关于使用深度学习破译老鼠的语言分析和介绍

多年来,研究人员知道我们可以通过啮齿类动物的叫声来了解它们的感受。就像狗摇尾巴一样,某些叫声表明啮齿动物很快乐。反过来,另一些叫声表明啮齿动物有压力,甚至抑郁。
但为什么研究人员会对啮齿动物的情绪感兴趣呢?因为研究人员想了解啮齿动物对各种刺激的反应。这有助于研究人员找到帮助成瘾者或抑郁者的最佳方法。通过简单分析啮齿类动物的交流方式,研究人员可以判断治疗是否有助于减轻抑郁情绪。
图片来源:alice gray
由于啮齿类动物主要通过人耳听不到的超声波发声(usv)进行交流,因此很难破译老鼠吱吱的叫声。超声波发声的范围为20千赫到115千赫,而人类通常可以听到20赫到20千赫的声音。
直到现在,研究人员在研究啮齿动物的叫声时,依然严重依赖耗时的人工分析。由于发声频率很高,研究人员不得不放慢播放录音的速度,才能听到叫声。即使使用专门的麦克风,对录音中的高音尖叫声进行标记和分类也是很费力费时的。这些方法也容易导致人为错误和误解。
华盛顿大学精神病学和行为科学系教授john neumaier博士告诉《数字趋势》杂志:“过去,为了更好地了解动物在行为测试中的情绪状态,研究人员将这些声音记录了下来。问题是,要对这些录音进行人工分析,就需要把它们放慢到人类可以听到的频率,这可能需要花费10倍的时间来听。这给研究人员带来了非常大的工作压力,使得他们不愿意用这种自然的方式来解读动物的情绪状态。”
因此,这个研究小组借助于人工智能(ai)来实现这一过程的自动化。他们的程序叫做deepsqueak,因为这项程序基于一种叫做深度学习的人工智能形式。
利用深度学习分析超声波发声
两位研究人员(华盛顿大学精神病学和行为科学系技术人员russell marx和华盛顿大学博士后研究员kevin coffey博士)与neumaier教授合作开发了用于检测和分析超声波发声的deepsqueak软件。他们的研究最近发表在《神经心理药理学自然杂志》上。
coffey说:“我们可以训练这个软件,以一种更类似于人类学习的方式来分析这些叫声。我们用图片和例子来说明叫声,而不是用数学来描述叫声是什么。”
deepsqueak将声音问题转化为图像问题。
deepsqueak的输入是一个音频文件(.wav或.flac)。deepsqueak将音频文件拆分为短的分段,然后将这些分段转换为图像(声波图)。下图显示了从原始音频文件到经过滤波的声波图的转换。
图片来源:kevin r.coffey、russell g.marx和john f.neumair
将声波图输入到一个深度学习人工智能程序中,这个程序可以对图像进行识别和分类,类似于自动驾驶汽车中用来识别停车标志和车道线的人工智能。它首先查看声波图中是否有吱吱声。如果有的话,是什么类型的吱吱声。
marx说:“deepsqueak使用仿生算法,这种仿生算法可以通过已经标记好的发声和噪音的例子来学习分离发声。”
图片来源:kevin r. coffey、 russell g. marx和john f. neumaier
该小组开始使用deepsqueak时,采用的是mathworks网站的示例代码object detection using faster r-cnn deep learning(使用faster r-cnn深度学习进行对象检测):
在此基础上,他们开发了deepsqueak软件包和matlab图形用户界面。deepsqueak使用了computer vision system toolbox(计算机视觉系统工具箱)、curve fitting toolbox(曲线拟合工具箱)、image processing toolbox(图像处理工具箱)、parallel computing toolbox(并行计算工具箱)和deep learning toolbox(深度学习工具箱)。
该技术有助于开发更好的成瘾治疗方法
这个研究小组的重点是精神病学和行为科学。
这项无损伤性研究发现,啮齿类动物在预期得到奖励(如,糖)或与同伴玩耍时最快乐。他们还发现,当雌性啮齿动物在附近时,雄性啮齿动物的行为也不同。情况正如预期,并无意外。
neumaier教授说,他的目标是开发压力失调和成瘾的治疗方法。deepsqueak使超声波发音的解码破译工作变得方便快捷,可以帮助实验室更快地实现目标。
他说:“如果科学家能更好地理解药物如何改变大脑活动,从而引起愉悦或不愉悦的感觉,我们就可以设计出更好的治疗成瘾的方法。”
该小组已经向所有研究人员开放了deepsqueak,他们可以创建自己的分析。代码在github上:
https://github.com/drcoffey/deepsqueak
该程序目前可以识别大约20种不同的超声波发声。该小组希望,当其他人识别和标记各种超声波发声时,他们能够为老鼠的叫声创建一个虚拟的“谷歌翻译”。
相关阅读:
直播预告 | matlab expo 2019,大师在线开讲 >>
深度学习网络到底在“看”哪里?
昆虫大脑完胜机器学习
使用 matlab 图像处理算法,视频实时加持蓝天背景
matlab 的艺术鉴赏的能力

oppor11什么时候上市?oppor11最新消息:大手笔邀热巴等巨星代言,oppor11下月发布仅售2999元
云视频会议对企业通信建设的积极作用
板对板连接器的测试要求
氧化锌非线性电阻测试电源系统
如何bmp格式转换为jpg格式
关于使用深度学习破译老鼠的语言分析和介绍
是什么决定晶振的频率?
为什么说L3是智能驾驶赛道中的一段弯路
三大主力产品遭遇窘境,苹果为何走下坡路
美的电压力锅说明书_美的电压力锅使用方法
直条和螺纹钢均可检测的棒材测径仪
瑞波科涂布型OLED相位差补偿膜等项目8月底前封顶
微控制器中的固件实现无人机电机功能
【喜讯】芯盾时代入选中国数字安全百强“中坚力量”
为你的汽车应用挑选一款温度感测解决方案
汽车MEMS传感器的国产化趋势,仅仅靠低成本?
新汉推出高性价比车载计算机VMC1000
研华科技发布全线32GB内存
高通和任天堂合作开发增强现实头戴设备,助力AR软硬件发展
山东淄博的发展更离不开“芯”的血液与“智”的飞跃