第一句子大全,网罗天下好句子,好文章尽在本站!

人工智能自然语言处理有了新突破!两篇论文来自广州

时间:2023-11-28

这两篇论文均聚焦中文分词领域,是深度学习引入知识后的有益尝试,将该领域近年来广泛使用的各数据集上的分数刷至新高,在工业中也有着可观的应用前景

友情提示:本文共有 1093 个字,阅读大概需要 3 分钟。

近日,自然语言处理领域(NLP)顶级学术会议 ACL 2020 上,来自创新工场大湾区人工智能研究院的两篇论文入选。这两篇论文均聚焦中文分词领域,是深度学习引入知识后的有益尝试,将该领域近年来广泛使用的各数据集上的分数刷至新高,在工业中也有着可观的应用前景。

记忆神经网络破解NLP瓶颈

分词及词性标注是中文自然语言处理的基本任务,尤其在工业场景对分词有非常直接的诉求。

句法标注本身需要大量的时间和人力成本

中文语言因其特殊性,在分词时面临着两个主要难点。一是歧义问题,由于中文存在大量歧义,一般的分词工具在切分句子时可能会出错。例如,“部分居民生活水平”,其正确的切分应为“部分/居民/生活/水平”,但存在“分居”“民生”等歧义词。“他从小学电脑技术”,正确的分词是:他/从小/学/电脑技术,但也存在“小学”这种歧义词。

二是未登录词问题。未登录词指的是不在词表,或者是模型在训练的过程中没有遇见过的词。例如经济、医疗、科技等科学领域的专业术语或者社交媒体上的新词,或者是人名。这类问题在跨领域分词任务中尤其明显。

对此,在论文提出了基于键—值记忆神经网络的中文分词模型。举例来说,在“部分居民生活水平”这句话中,到底有多少可能成为词的组块?单字可成词,如“民”;每两个字的组合可能成词,如“居民”;甚至四个字的组合也可能成词,例如“居民生活”。

把这些可能成词的组合全部找到以后,加入到该分词模型中。通过神经网络,学习哪些词对于最后完整表达句意的帮助更大,进而分配不同的权重。像“部分”“居民”“生活”“水平”这些词都会被突出,但“分居”“民生”这些词就会被降权处理,从而预测出正确的结果。

可用于广告投放与翻译等场景

那么,新的方法将有助于解决哪些问题呢?创新工场大湾区人工智能研究院执行院长宋彦告诉南方+记者,广告投放与内容匹配是一个非常典型的应用前景。

“应用中会面临一个挑战,当我们的模型训练是在某一个领域,而需要把这个模型用到其他领域或者需要事先准备一些关键词和相关知识的领域,比方说在新闻领域的模型,如果碰到一个体育领域的广告文本,或者是服装领域的广告文本,那么其中很多词会没办法正确切分出来。”宋彦说。

此时,使用新的模型时,在新领域进行广告内容推荐,新领域的知识和事先准备的关键词等,加入到模型中,从而把目标文本中一些比较有效的关键词,通过更好的分词结果呈现出来,使用户在搜索时,得到的广告内容与搜索结果相匹配。

此外,新的模型应用在翻译软件时,更好的分词结果往往能够在更大的词汇层面带来更好的语义信息,也将对翻译任务有更好的帮助。

【来源:南方plus客户端】

版权归原作者所有,向原创致敬

本文如果对你有帮助,请点赞收藏《人工智能自然语言处理有了新突破!两篇论文来自广州》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
床长人工智能教程pdf下载——文本自动生成研究进展与趋势

床长人工智能教程pdf下载——文本自动生成研究进展与趋势

...一天计算机能够像人类一样会写作,能够撰写出高质量的自然语言文本。文本自动生成就是实现这一目的的关键技术。按照不同的输入划分,文本自动生成可包括文本到文本的生成意义到文本的生成数据到文本的生成以及像到文...

2023-11-20 #经典句子

同盾科技两篇论文入选人工智能顶级会议AAAI

同盾科技两篇论文入选人工智能顶级会议AAAI

...率)作为会议口头报告。会议论文主题涵盖计算机视觉、自然语言处理、机器学习、知识表达、逻辑推理等多个前沿领域,同盾作为重要的中国企业代表,在当前人工智能行业最前沿的竞技舞台上取得亮眼表现,其背后反映出很...

2023-05-30 #经典句子

语言之精妙彰显人类之精巧 人工智能能否习得?

语言之精妙彰显人类之精巧 人工智能能否习得?

...习 NLP 乃至计算机视觉领域的任务。简单来说,就是针对自然语言处理(NLP)和计算机视觉领域的多种高难度任务,他们首先用语言解释这些任务,然后使用深度神经网络模型来学习这些语言解释,进而帮助解决这些任务。事实...

2023-11-24 #经典句子

DeepMind最新论文:强化学习“足以”达到通用人工智能

DeepMind最新论文:强化学习“足以”达到通用人工智能

...间的边界等等。同样,我们对语言的理解有助于开发各种自然语言处理系统,例如回答问题、文本生成和机器翻译。这些都是狭义人工智能的实例,这些系统旨在执行特定任务,而不是具有一般解决问题的能力。一些科学家认为...

2023-11-05 #经典句子

人工智能探测无声言语并合成语音

人工智能探测无声言语并合成语音

...“无声语音的数字发声”的模型论文在上周在线举行的“自然语言处理的经验方法”(EMNLP)活动中获得了最佳论文奖。 Hugging Face公司在开源Transformers库上的工作获得了组织者的最佳演示论文奖。

2014-08-15 #经典句子

人工智能基础篇1——计算机处理自然语言的一些问题

人工智能基础篇1——计算机处理自然语言的一些问题

...,那么首先就要面对以下问题:问题一:计算机能否处理自然语言。计算机科学之父阿兰图灵(Alan Turing)在他的一篇论文中提出了一种验证机器是否有智能的方法,这种方法也被称为图灵测试(Turing Test):让人和机器进行交...

2020-05-24 #经典句子

谷歌人工智能可改变句子时态 语态属性

谷歌人工智能可改变句子时态 语态属性

...可以补充微软研究所11月展示的系统,该系统利用复杂的自然语言处理技术来推理弱结构文本中的关系。“在这项工作中,我们解决了修改句子文本属性的问题。”研究人员写道。“据我们所知,我们演示了首个能够在没有并行...

2023-05-18 #经典句子

《麻省理工科技评论》:百度AI亮出新招教会人工智能学习语言含义

《麻省理工科技评论》:百度AI亮出新招教会人工智能学习语言含义

...方网站报道称,百度预训练模型ERNIE超越微软和谷歌获得自然语言处理领域权威数据集GLUE最高分。《麻省理工科技评论》指出,GLUE测试的满分为100分,人类的平均得分大概在87分左右,百度ERNIE则是在业界首次突破了90分。百度...

2009-07-30 #经典句子