亚马逊宣布:他们计划向公众公开“Topical Chat”数据集

4月1 日, 亚马逊宣布:他们计划向公众公开“topical chat”数据集,超410万单词21万句子的语料库将于2019年9月17日发布。
该数据集是为参加alexa prize socialbot grand challenge 3竞赛的团队开发的,申请截止日期为2019年5月14日,比赛于2019年9月9日开始。所有参加alexa prize竞赛的团队将可以访问此数据集的扩展版本(扩展主题聊天数据集),其中包括正在进行的集合和注释的结果。
主题聊天数据集将包含超过210,000个句子(超过4,100,000个单词),可支持高质量,可重复的研究,将成为研究界公开可用的最大社交对话和知识数据集。
每个语料库的对话和对话轮次与提供给众包工作者的知识相关联,并且所述知识是从与一组实体相关的一系列“非结构化”和“松散结构化”的文本资源中收集的。
亚马逊高级首席科学家dilek hakkani-tur在博客文章中明确表示,没有任何语料是与alexa客户的互动。
该数据库是实现基于知识的神经反应生成系统的后续研究,解决其他公开数据集无法解决的自然对话中的难题。这将使研究者可以专注于研究对话中主题和知识选择方面的转换,以及如何在对话中融入事实和观点。

信通传媒全媒体成功组织了“移动转售产业与大数据产业交流座谈会”
上海大学6支创新项目分别获艾睿“创新杯”万元奖学金
便携式微生物快速检测仪的特点
智慧消防巡检系统在高速公路隧道的应用
介绍一款新型MXene化学电阻式气体传感器
亚马逊宣布:他们计划向公众公开“Topical Chat”数据集
NB-IOT开启万物互联时代
未来16位MCU市场逐渐萎缩 并重新定义 MCU
示波器分段存储原理讲解及案例分析
一加3T评测 性价比高值得购买
联想表示将在2000元价位段全面打败小米和荣耀
扒一扒RocketMQ中会导致消息重复消息的原因
上交清华提出中文大模型的知识评估基准C-Eval,辅助模型开发而非打榜
欧菲科技研发布局柔性触控,加速步入柔性显示时代
特斯拉:电子后视镜取代传统后视镜在即
RC电路、微分器、滤波器的简单知识了解
BoltHub推出隐形扩展设备连接器
ABB工业机器人数据备份与恢复的方法教程
单双张传感器,baumer超声波传感器轻松实现单双张检测识别
一般APR常用到的类型有哪些