在今年8月召开的百度技术创新大会上,百度CEO 重磅抛出“框计算”这一全新技术理念,并成为行业、企业以及学术界持续热议的话题。近日,哈尔滨工业大学信息检索中心主任、中国中文信息处理领域学术带头人刘挺对这一理念发表了自己的看法。
他指出,“框计算”理念的提出,将大力推动中文信息处理技术的研发进程,给自然语言处理的研究者带来机会。
所谓“自然语言处理”,就是用计算机去处理语言文字。随着互联网的大规模应用,其所呈现出爆炸式增长的数据量在客观上推动了对语言信息处理的需求。语言信息处理的中心目标是让机器理解人类的语言,但互联网上过大的信息量往往造成处理速度的延迟,导致语言处理只能采用分词这样的最简单的处理方法,把汉语的句子切分成词,然后进行检索。
刘挺指出,2000年前后业内便已提出“开放域问答系统”这样的课题,试图理解用户的提问,并给出精准的答案。如果系统无法理解清楚用户的搜索请求,还可以自动产生反问,在交互中寻求解答。但由于技术难度非常大,离实际应用还很远,不太容易做好。而百度目前基于“框计算”技术所提供的诸如“火车时刻表”等搜索服务,通过简捷的交互方式提供了一个实用的“问答系统”应用范例。
“可以说,框计算把我们原来有点破灭的开放域问答的理想激活了,同时又启示了我们真正的应用应该是什么样子的。”刘挺表示,受框计算的启发,自己接下来将重点研发开放问答系统,这其中包括三部分:问题的理解、文档片段的检索和答案抽取,而其中又将把“问题的分类与理解”作为重中之重。
在刘挺看来,框计算不只是极大地扩展了搜索引擎的概念,更具有与操作系统紧密结合的可能。“原来我们认为搜索引擎就是信息获取的一个工具,用户要找什么信息,搜索引擎就提供什么信息给他,但是在框计算理念下,未来的框就相当于用户的一个助手,不光能回答问题找寻信息,还可以帮助用户执行具体操作。”
比如,如果用户的冗余文件过多,现在的做法是打开资源管理器,手动输入指令;但是在未来,用户一开机弹出来的就是相当于用户助手的框,它不光能回答问题,还可以帮助用户执行具体操作。比如输入“请你帮我把**文件删除”、“请你对**文件进行排序”、“请你给我预定去**的航班”等语句,框就能自动帮用户完成这些需求。 不过他也指出,要想真正实现这一过程,还需要解决许多难点,因为汉语的形态和应用要比英语灵活多变,这也为句法和语义分析的准确性提出了很高的挑战。
“框计算背后对应的就是互联网的智能人机交互界面、一站式和集中式的服务等理念,它的出现是历史发展的必然。百度目前已经找对了方向。”刘挺评价认为,中国的互联网信息处理领域将从框计算中受益,框计算把相关应用都提升到了新的高度,而这“也得益于百度CEO李彦宏的战略眼光”。
为了更好地实现框计算技术向实际应用的转化,刘挺特别建议称,百度应当和高校、研究所等学术研究机构紧密合作,结合双方的优势来共同开发“框计算”,以便更好地满足用户需求。