文本相似度计算旨在识别两段文本在语义上是否相似,是自然语言处理领域的一个重要研究方向,其在智能问答、信息检索等领域都发挥重要作用,具有很高的商业价值。
近期,思必驰知识服务团队在中文文本相似度计算方向投入研究,并取得阶段性成果:
1)在第十四届全国知识图谱与语义计算大会(ccks: china conference on knowledge graph and semantic computing)[1]上发表相关论文一篇《neural fusion model for chinese semantic matching》。
该会议是国内知识图谱、语义技术、链接数据等领域的核心学术会议,聚集了知识表示、自然语言理解、知识获取、智能问答、链接数据、图数据库、图计算、自动推理等相关技术领域的和研究人员的学者和研究人员。
2)在“千言数据集:文本相似度”评测[2]中取得阶段性进展。该评测的文本相似度数据集包括公开的三个文本相似度数据集,分别为哈工大(深圳) lcqmc 、 bq corpus和谷歌的 paws-x(中文)。目前,思必驰知识服务团队在三个数据集上均暂列第一。
针对中文文本相似度计算的鲁棒性和泛化性问题,思必驰知识服务团队在以下几个方面开展了技术研究: 1)针对中文特点的字、词融合编码器; 2)基于预训练模型的领域自适应训练; 3)目标应用领域导向的多阶段模型微调。 相关技术实现在上述公开评测中得到了应用和验证。 语言智能常被称为人工智能皇冠上的一颗明珠。在未来,思必驰知识服务团队将继续深耕认知智能领域,在面向通用领域的文本相似度计算基础上,打造领域自适应的文本相似度计算系统,推动文本相似度在垂直领域的应用和发展。
原文标题:【会员风采】思必驰在中文文本相似度计算任务上的探索与进展
文章出处:【微信公众号:深圳市汽车电子行业协会】欢迎添加关注!文章转载请注明出处。
OPPOR7PLUS高清图赏
T载波,T载波是什么意思
万物互联为何需要“信息高铁”
密勒电容对放大电路频率的影响
商业往事丨第79话:老产品的新生命
思必驰在中文文本相似度计算方向上取得阶段性成果
基于PSoC3可编程嵌入式片上系统的智能手机电池充电器
什么是CPU扩展总线速度/Register Pressure
华为高颜值千元神机发布,荣耀8青春版深度评测
teamviewer工作原理是什么
介绍CAN总线基础知识
中兴通讯ICT产品方案和数字化能力体系获广泛认可
RL78/G15快速原型开发板(FPB)演示
如何使用IOT-MCU/ESP-01-DHT11板和AskSensors物联网平台监控温度和湿度测量
全球首个AI英语老师在中国诞生 —人工智能对教育行业新一轮革命
巨屏影音娱乐王: 荣耀Note8图赏
智能电网属于什么产业
FAS裁定苹果App Store滥用移动应用市场主导地位
小鹏汽车与广东汇天合作研发飞行汽车,预计2025年第四季度量产
红米Pro月底即将发布? 网友:等小米平板3快等哭了