要使用Gpt-embedding计算两组在不同主题下的相似度,可以按照以下步骤进行: 1. 准备数据 收集公司文档 D c D_c Dc 和政府文档 D g D_g Dg。 2. 定义主题和关键词 设定主题集合 T = { t 1 , t 2 , … , t n } T = \{t_1, t_2, \ldots, t_n\} T={t1,t2,…,tn} 和对应的关键词集合
遇到问题 BERT模型中最后一层的句子的CLS的embedding怎么获取? 来源于阅读 An Interpretability Illusion for BERT这篇论文 We began by creating embeddings for the 624,712 sentences in our four datasets. To do this, we used the BERT-b