本篇文章461字,读完约1分钟

在人工智能领域,理解语言的人能够赢得世界是一个共识。其中,能够帮助人工智能识别人类语言的自然语言处理(nlp)被誉为人工智能语言的皇冠上的明珠。

当人工智能自然语言处理技术遇到汉语绕口令、小意思等多义词时。,要求你控制,而不希望你控制地面和地下,如何理解这些十级汉语句子?近日,记者在成都举行的讯飞未来科学堆栈活动上采访了相关专家。

能够区分单词和断句的机器仍在努力工作

Nlp是机器让计算机理解和处理人类自然语言的技术。自然语言处理与计算机视觉和语音处理的区别在于信息处理的类型。

计算机视觉主要处理图像,语音技术处理声音,自然语言处理主要处理单词的理解。云浮科技创始人兼首席执行官张文斌表示,在人工智能中,语音识别是耳朵,语音合成是嘴巴,计算机视觉是眼睛,自然语言处理负责将抽象的单词和符号转换成计算机能够理解的语言。

“中文十级”难题,AI怎样解读

& lsquo人类很难理解汉语10级的一些句子,更不用说计算机了。张文斌说,在说和写的过程中,汉字往往没有字与词之间的界限。即使机器能准确识别单词,也很难理解它的意思;另一个例子是各种地方口音和方言,它们也是绊脚石。

“中文十级”难题,AI怎样解读

自然语言处理通常从最小的语义单位开始。词开始是分词算法。这是最简单也是最成熟的。张文斌说,nlp的算法分为语法层和句子层分析,其中分词是为了切分单词,这样机器就可以理解哪些单词组成一个单词,哪些单词组成一个句子,从而理解整个句子和段落的意思。然而,在分词的实际应用中仍然存在各种问题。

“中文十级”难题,AI怎样解读

张文斌解释说,首先,分词标准是不确定的、模糊的,新词和实体词是有问题的。例如,乒乓球、乒乓球拍和拍卖都卖完了,这是正确的,不管它们如何划分,这取决于环境。其次,网络词汇每年都在涌现,以前不存在的词汇,如“未知是什么?”和“佛教”,也需要计算机来理解。

“中文十级”难题,AI怎样解读

听语气,判断关系。人工智能有了新的技巧

如何让机器理解上下文,从而进一步理解整篇文章的意思?

我们将尝试在收听人类语音时使用停顿信息来帮助分词算法。讯飞翻译业务主管翟继波表示。

对于人工智能工程师来说,更重要的是深层算法,比如实体识别和属性提取。也就是说,在识别诸如人名、地名和机构等实体之后,我们可以提取实体之间的关系,并找出句子中不同实体的不同属性。张文斌说,还有很多算法,比如情感分析,它分析文本中包含什么样的情感,是积极的、消极的还是中性的;文档摘要,从长文本中生成一个一两百字的简短摘要。基于这些算法层,可以完成许多自然语言处理的衍生应用,包括自动问答、机器翻译等。

“中文十级”难题,AI怎样解读

如何识别方言?在IFlytek的新型翻译机器设备中,首次引入了方言翻译功能,可以将河南方言、东北方言和广东方言相互翻译或翻译成外语。翟纪波说,对于不同类型的方言,机器采用不同的翻译过程,将属于北方方言区的河南方言和东北方言先翻译成普通话,再翻译成外语;对于粤语等南方语言,我们建立了一个独立的语料库来直接将粤语翻译成外语。考虑到方言中有许多地方表达、语言和词汇。熊琪& lsquo初中和高中也可以作为独立的语料库,可以单独用机器学习。他说,人工智能的优势在于,它可以在自然语言处理中不断地从用户那里积累语料库,学习新的单词和短语,并不断地更新自己的数据库和语料库。

“中文十级”难题,AI怎样解读

标题:“中文十级”难题,AI怎样解读

地址:http://www.ictaa.cn/hlwxw/5782.html