萧国政:让语言理论指导文字应用

   “决战前沿,造福人类。”很多人把这句话当成空话,文学院语言与信息研究中心教授萧国政将它挂在中心网站上,并不懈地研究和践行。“应用语言学离生活很近,是对大家都有用的学问,研究它会让我们感觉到自己对社会是有用的人,人们最需要什么,我们就干什么。”萧国政说。
  
  规则研究是本,理论研究是魂,应用研究是魄,这是萧国政一贯坚持的研究原则。在他的力促下,武汉大学语言与信息研究中心2004年成立,整合了文学院、计算机学院、外国语言文学学院和新加坡信息通讯研究所等学术力量,定位为文理交叉、国际合作、人才培养、具有研究-教学-产品转化功能的联合研究机构,陆陆续续进行一些重大课题开发。其中经费金额较大的两个横向课题是黄草体手写汉字脱机识别软件和与广东国笔科技有限公司合作的广东省产学研项目“嵌入式多语言文本信息交互系统”。
  
  2006年,杰出校友、美国黄彰任先生委托该中心开发黄草体手写汉字脱机识别软件,语言与信息中心发挥多学科交叉优势,集体攻关,开发的软件,经检验,识别黄彰任先生的草体,效果明显,得到了他的充分肯定。
  
  “我们的研究得到黄先生的认可,充分显示了武大在此领域的实力。”萧国政说。脱机手写汉字识别的用途是把手写字符用字符阅读器自动输入计算机,常用于信函分拣、银行支票识别和统计报表处理以及手写文稿的自动输入,具有十分广阔的应用前景。“从工作原理上说,脱机手写汉字识别和印刷汉字识别是一样的,但是由于手写汉字字形变化大,脱机手写汉字识别是一个技术难题。”萧国政介绍,近几十年来各国学者做了很多研究工作,提出了一些思路和方法,但是目前还没有哪一种方法能够解决自由书写的汉字识别问题,已发表的一些实验系统的性能也都不够好,难于付诸实用,在这个方面目前还很少有成熟的商用系统。
  
  “嵌入式应用是后PC时代IT技术的发展趋势,嵌入式系统应用牵涉到诸多技术层面,其中语言技术是最为关键的技术,我们在此领域的研究意味着抢占技术和应用的先机。”中心成员胡惮副教授说。
  
  目前智能手机和掌上电脑联网检索信息的功能主要是对桌面电脑网络搜索的模拟,反馈给用户的是一大堆网页链接信息,用户不能直接得到所需的结果,而需要对反馈的离散信息人工进行二次筛选判断,手持嵌入式系统显示面积一般很小,用以浏览本来是为桌面系统设计的网页,自然十分吃力,得不到对反馈结果的评价。
  
  为了解决这些问题,是个人信息助理真正成为用户口袋中具备专家辅助决策功能的高效、实时的信息处理终端,“嵌入式多语言文本信息交互系统”项目致力打造一套给予多项文本检索与数据抽取技术的“掌上生活信息智能检索系统”,目前该系统即将问世。
  
  “3G时代的来临将带来手持嵌入式设备井喷式的市场需求,新的功能和应用需求在不断翻新。良好的人机交互界面和高端的智能应用都离不开自然语言处理技术。不断加强和深入该领域的产学研合作,是新时代赋予学者和实业家共同的神圣使命。”萧国政的博士研究生、广东国笔科技有限公司总裁高精鍊说。
  
  百尺竿头,更进一步。萧国政及所在团队下一个目标锁定在“网络舆情检测”项目,在“立足事实,探求理论,指向应用”的道路上,他们越走越远。
微信扫描二维码
扫一扫二维码,即可分享文章到微信!
<!--统计代码-->