自然语言处理与表示学习

Date:

自然语言通常指人类的语言,是思维逻辑的载体,交流沟通的方式,也是传承文明的手段。对自然语言的处理是人工智能的重要研究内容,被称为人工智能皇冠上的明珠。自然语言处理必不可少的基础步骤是语言表示学习,其目的是构建自然语言的形式化或数学描述,以便在计算机中表示自然语言,并能让计算机程序进行自动处理。早期的语言表示方法主要采用符号化的离散表示。近年来,深度神经网络广泛应用于自然语言处理,不仅在文本分类、序列标注、机器翻译和自动问答等许多任务中取得了超越传统统计方法的性能,而且能以端到端的方式进行训练,避免了繁琐的特征工程。报告的第一部分将介绍自然语言处理的基本任务、应用领域、研究历史和技术发展趋势;第二部分将从词语、短语、句子和句对等粒度介绍基于神经网络的语言表示学习方法,阐述如何将语言的潜在语法或语义特征分布式地存储在一组神经元中,用稠密、低维、连续的向量来表示,并从模型、学习等层面讨论神经语言表示学习的近期研究趋势。

More information here