跳至正文

基于遗传算法的诗词句生成初探

自然语言和各种符号语言是人们进行推理和交流的桥梁。由于语言在智能活动中具有举足轻重的作用,当计算机在不同领域逐渐替代人类完成各项工作时,人们也期待着计算机在自然语言处理上可以接近甚至达到人类的水平。

诗歌是一种用语凝练、结构跳跃、富有节奏和韵律、高度集中的反应生活和表达思想感情的语言形式,是人类智慧在语言层面的一个闪光点。中华民族的诗歌文化源远流长,但一直以来,其研究大多局限于语言和艺术领域,运用计算机语言学手段对中国古诗词进行研究则处于启蒙阶段。

主要研究内容:

在对机器自动生成词句的现有方法进行总结和分析的基础上,本文提出了基于遗传算法的词句生成模型并进行了系统实现.

我们主要是借鉴汉语计算语言学研究在词汇语义分析方面已取得的成果,建立切分和音韵标注语料库.然后在此基础上,针对现代汉语,提出了基于 DFA 的句法判定规范,以及基于词义相似度、词义相关度、词汇风格和情感特征的语义度量.最后,我们根据词句特点,设计了包括基因编码,适应度计算,选择、交叉、变异等遗传操作在内的具体遗传算法,并构建系统加以实现。