X

加拿大华人科学家孙靖夷:人工智能领域的开拓者

搜索下载华舆APP(中新社旗下新媒体平台),关注全球华侨华人,浏览世界各国媒体新闻资讯,无需翻译——华舆在“手”,世界尽在掌握!

华舆讯 据加拿大七天报道,当我们拿起手机,无论是在微信上跟朋友聊天还是在记事本上写下备忘,无论是手写输入还是用拼音、联想、笔画等等五花八门的输入方法,我们从来不会想到是谁在我们的背后用心血和汗水发明或者创造了这些方法,而是愉快地享受着科学的进步带给我们的便利。

人工智能领域的开拓者

——Concordia大学终身教授、国际知名电脑专家、语音学专家、加拿大皇家科学院院士孙靖夷博士

▲(图片来自加拿大七天)

2018年4月17日,七天传媒收到孙靖夷教授的邀请,他在邮件中说:“我很高兴地邀请您参加将于2018年5月13日至17日在加拿大魁北克省蒙特利尔市康考迪亚大学举办的‘模式识别和人工智能’国际会议(ICPRAI 2018- International Conference on Pattern Recognition and Artificial Intelligence)。这是由模式识别和人工智能中心主办的,该中心在过去三十多年来一直从事机器学习、智能和人工智能方面的研究。会议邀请了来自世界各地的研究人员分享和展示他们在模式识别、计算机视觉、图像处理、医疗成像、人工智能、深度学习、生物识别和大数据分析方面的研究成果。”

孙靖夷是世界人工智能界的大咖,穷40多年的努力,成为科学牛人,他开创的文字识别系统大大刺激并促进了整个世界手写识别和文档处理的研究与进程,从而奠定了人工智能输入方式,让我们的生活变得便捷。

为了帮助记者深刻领会人工智能领域和这个活动,孙靖夷在随后的邮件中又进一步做了解释:会议组委会由蒙特利尔4所大学和世界6大洲知名专家组成,一个覆盖PRAI(人工智能模式识别)领域的9位世界知名主题演讲者组成的梦幻团队,对提交给大会的160个与手写输入和文档识别相关的文稿进行演示和分析,同时广泛与深入地分享他们在计算机视觉和图像处理、机器学习和网络深入,生物识别和医学图像、法医学、视频处理和监视、智能分类器和各种应用程序等方面的见解。怕我们感觉枯燥,孙教授在邮件末尾标注:活动有互动、有交流、很有趣。

有感于孙教授在科学领域的深入研究,同时得益于他在人际交往中的细致入微,七天记者欣然前往采访了这次活动,果然受益匪浅。

这次活动一结束,孙靖夷就获中国广东省中山市的邀请,作为中山市的顾问,把2020年的世界人工智能大会移师中山。

▲本文收录在《鸢尾花下——奋斗在魁北克的华人》一书中。(七天传媒出版社 2019)(图片来自加拿大七天)

科学高峰

孙靖夷(Ching Yee Suen)出生在中国广东省中山县沙边村。他6岁去了香港,1968年从香港大学电机电子工程系硕士毕业,72年获加拿大哥伦比亚大学(UBC)博士学位,同年来到蒙特利尔Sir George Williams University任教,该校于1974年与Loyola College合并,更名为Concordia。从1972到2019,从助理教授到终身教授,孙靖夷在Concordia大学已经整整工作了47年。在这47年里,不算本科生,孙靖夷培养和指导了硕士研究生80余名,博士生40名,访问学者100多名;在这47年里,他担任过该校计算机科学系主任、工程与计算机科学研究院副院长等行政职务,他应邀在包括中国在内的多国科研机构和大学开讲座、搞科研、任兼职教授;在这47年里,他发表文章500余篇,出版著作15部,文献被引用超过5万次,是被引用频率最高的科学家之一;1990年、1991年孙教授分别创立了两个新的人工智能国际会议:国际手写识别前沿会议(International Conference on Frontiers in Handwriting Recognition)、文件分析和识别国际会议(International Conference on Document Analysis and Recognition);在这47年里,他还参与创建了“国际中文计算机学会”,组织召开了多次国际学术会议。1986年孙靖夷教授获美国电子学院院士称号(Fellow,IEEE,Institute of Electrical and Electronics Engineers,Inc.),1994年获国际模式识别学会院士称号(Fellow,IAPR,International Association for Pattern Recognition),1995年获加拿大皇家科学院院士称号(Fellow,Academy of Sciences, Royal Society of Canada);2002、2008、2011、2014,孙教授作为大会主席主持召开了多个国际人工智能大会,单是2002年在魁北克城的一次,参会人数就达1千多人。这些年,他参加的类似国际会议更是数不胜数,他所获得的荣誉可谓实至名归。

首创盲人阅读机

1968年,孙靖夷在BC省哥伦比亚大学(UBC)攻读博士学位,导师交给他一个史无前例的课题:发明一台能发出声音的机器。换句话说,就是要让电脑学会读书,然后念给盲人听,以解决盲人阅读问题。孙靖夷指着一排书架说:“那时的电脑很大,我们让电脑对书籍进行扫描、识别,把文字变成声音。这项研究不仅实用价值大,也为计算机领域开创了一条新的路线。”四年后,孙靖夷交出了导师满意的成果,首创了阅读机器,也使他从此走上用计算机识别文字,解决语言学和其他相关学科难题的科研道路。

说到电脑识别文字,我们就会联想到今天在手机或电脑上书写的技术,孙靖夷纠正说:“我们的研究是非线上的,也就是说我们的研究对象是已经写好了的文字,不同于当你写字时是有信息的,一横一竖电脑全能捕捉到。我们研究的是在所有这些信息都不复存在的情况下如何去进行识别,因此比想象的要难得多。”

经过40多年的探索,孙靖夷已经把最初的研究领域大大扩展。例如,当年研究的对象只是文字识别,现在发展到模式识别,像卫星拍摄的地球表面,通过模式识别,可以确认哪个是道路桥梁,哪个是军事设施,甚至汽车牌照都可以识别出来;当年发明盲人阅读机时,机器只能识别印刷体,现在发展到可以识别手书体,如手写的支票和手填的表格;当年的研究只是针对英文这一种文字,发展到今天,孙教授和他的学生们开发的软件已经可以识别法文、中文、阿拉伯文、波斯文等十几种文字了。目前纳入孙教授研究计划的还包括对图像的识别。说到这儿,孙教授打开一本书,图中一人的脸上被糊上了蛋糕。教授说,我们现在可以通过对一个人相貌特征的模式化识别记忆,透过蛋糕辨认出这个人是谁。果然,再看下一张图片,记者依稀认出此人是比尔盖茨(Bill Gates)。

创新汉语国音系统

作为一名华人,孙靖夷顺理成章把研究汉字放在重要日程上。从1975年起,刚到康大不久的孙教授就开始探索汉字的规律了。他说:“上世纪七、八十年代,中国计算机热了起来,汉字的输出输入成为首先要解决的问题,以前没有人做过,于是我选择了这个课题。”在研究过程中,他走访过中国的语言研究所和声学研究所,还到美国、加拿大、新加坡、日本和欧洲一些国家结交同行朋友,1979年他发明了一套新的汉语国音系统,在瑞士出版了第一本关于电脑识别汉字的专著《电子计算机国音研究与分析》,并协力创建了“国际中文计算机学会”。孙教授说:以往的汉语语音系统,有注音符号系统,有汉语拼音系统,还有耶鲁大学发明的系统等,都有弱点。我发明的这个国音系统是经过了数年研究,利用电脑分析了大量的语音,并参考了很多文献创造出来的。其特点是字符与发音一致,易拼易念易学,特别是对母语是英语的人来说。比如,“的”的汉语拼音是“de”,讲英语的人容易念成“弟”,而我的语音系统,“d”还是“d”,“e”用“uh”标注,看到“duh”,他们就能发出“的”这个正确的音来。再例如,“q”,外国人发“k”,我用“ch”代替。而所有的卷舌音我都加上“r”,“zh”,我用“rj”;“ch”,我用“rc”;而“r”保持不变。记者看到在37个元、辅音中,孙教授的语音系统有25个与汉语拼音相同,28个与耶鲁语音系统相同。例如汉语拼音的“c”,孙氏和耶鲁的标注都是“ts”。

记者关心这套新的语音系统是否可以推行,孙教授说:“推行一套语音系统是国家行为。国家推行汉语拼音几十年,人们已经熟悉了。就像我们现在用的键盘,它键子的设计并不是最好的,但人们已经习惯了。”

“那如果不能推广应用,您会不会有挫败感?”记者问。

“我没有挫败感。”孙教授肯定地回答:“我的目的并不是要推翻现行的什么,而是为让说英语的人学习汉语更加容易。我没有时间去推广,也不一定要去推广,因为我的系统也有弱点,我只希望自己的研究能够对将来汉语拼音的完善提供帮助。”

揭示汉字语音规律

1986年孙靖夷出版了一部专著,书名是《Computational Studies of the Most Frequent Chinese Words and Sounds》。孙教授指挥电脑,利用识别技术从100万个常用字和常用词中找出使用频率最高的6321个,再对它们进行智能化分析,从而总结出汉语的十个语音规律:元音(a)、双元音(ei)、三元音(iau)、元音+鼻音(an)、双元音+鼻音(iang)、辅音+元音(bo)、辅音+双元音(pau)、辅音+三元音(miau)、辅音+元音+鼻音(run)和辅音+双元音+鼻音(liang)。

孙靖夷还对这6321个最常用的字和词组按字面(Char.)、发音符号(syll.)、声调(tone,5个)、使用率(freq.)、使用频率占百分比(freq.%)、识别(ID)、排列(rank)等几个方面进行量化归纳列表,并绘制成图,令读者一目了然。例如,表格第一行清楚表明:使用率最高的汉字是“的”,符号是“duh”,声调是5,使用率为54438,占百分比6.8965(100万中),ID是749,排列为1。第二个是“是”,第三个是“在”,第四个是“一”,第五个是“不”……

对这个非常“逻辑”的结论记者并不吃惊,让记者吃惊的是若不是孙教授研究有方又精通电脑,如此庞大的工作量何人可以完成?

孙靖夷还把汉字分成结构,根据上下左右的结构配合找出偏旁字首的出现规律。电脑发现汉字中出现频率最高的偏旁是“口”,多有意思!

孙教授说:“我们做基础研究的,就是为应用科学提供方法和工具,比如我们找出了最常用的汉字偏旁是‘口’,就可以用键盘上最短的符号‘k’来代替,使输入最快。”

研究汉语的人很多,但是,像孙靖夷教授这样对汉语进行全方位的解剖分析,并将其规律如此简单、明白地“搬出来”,历史上还是第一次。

为了孩子们的眼睛

孙教授带记者参观了他6间实验室其中的两间,又在会议室旁听了对两名硕士研究生的指导,使记者对他目前开展的研究和将来的方向有了大致的了解。

孙教授说:“全世界近视眼出现的频率非常高。根据香港中文大学眼科及视觉科学系的统计,以中学生为例,中国香港:12~20岁,近视比率为57~80%;中国台湾:12~18岁,56~84%;日本:12~17岁,44~66%……

“中国大陆(内地)拥有世界上最高的近视率,13亿人口中有4亿近视眼。中学生的近视患病率是77.3%大学生是80%以上。根据报道,亚洲一些国家的近视患病率是70~90%,欧洲和美国是30~40%,非洲只有10~20%。

“针对这种情况,我们正在对不同的印刷品字体进行研究,看是不是笔划越多,字体越复杂,人们阅读越慢;而阅读时间越长,眼睛的受损就越大。我们试图找出比较容易看,能降低眼睛疲劳的字体。”

▲2018年6月22日,孙靖夷在七天传媒主办的《加拿大华人精英录》首发式“星光耀蒙城”活动现场。(图片来自加拿大七天)

经过三年多对中文字体的研究,他们发现人们在阅读“方正魏碑体”时的速度最快,这说明了不同字体确实影响阅读速度,而速度快慢直接关系着人眼能量的消耗。在2011年9月由中国自动化研究所主办的“国际文件处理大会”上,孙靖夷教授发表了怎样评估字体,提高文字易读性的演讲。他把孔子的“听而易忘,见而易记,做而易懂”的名言翻译成英文:“I hear and I forget. I see and I remember. I do and I understand.”然后加上他自己发现的一个“secret(秘密)”,并发明了一句话:“I read and I know.”制成幻灯片,以强调“阅读”在今日人们生活中的重要程度。他说:“由于教育的提前、电脑的普及,现在每个人都看书、看手机上的信息,眼睛的负担很重,很多孩子四、五岁就戴眼镜了。我们希望在多种文字中找到各自最易读的字体和方法。减少人类的近视率。”

孙靖夷的团队和中国的方正公司合作设计出更加优化的字体,保护小朋友的眼睛。这项研究在中国还是首次。

他同时与英国雷丁大学(University of Reading)的 Mary Dyson 教授编辑了一本书《数字字体和阅读》(Digital Fonts and Reading),分析字体及其易读性,提供减轻眼睛压力的方法。

埋头苦干 奋斗到底

孙靖夷年轻时每天工作10~12个小时,现在岁数大了,每周仍工作50~60个小时。他从1988年至今,担任康考迪亚大学模式识别和机器智能研究中心主任(Director, CENPARMI,Centre for Pattern Recognition and Machine Intelligence),兼任模式识别杂志社主编;国际模式识别协会(IAPR)顾问委员会成员,国际模式识别会议(ICPR)咨询委员会委员和中国科学院模式识别实验室咨询委员会成员等职务。

孙教授永远把工作放在第一位,最大的娱乐是偶尔看看粤剧节目、哼哼家乡小调。记者问教授可曾度假、旅游,教授说:“我每年都会出国参加国际会议,这不就是旅游了吗?”再问教授他人生最大的乐趣是什么,他说:“我热爱电脑,热爱语言和文字。每当我的研究成果被人引用,每当我的学生找到好的工作,帮到了别人,就是我最快乐的时候。”

孙靖夷除了是一位科学家,还是一位多产的作家。他的新书《人工智能和模式识别前沿》“Frontiers in Artificial Intelligence and Pattern Recognition”刚刚由 World Scientific 出版公司出版。他对《七天》说:“‘埋头苦干、自强不息、精益求精、奋斗到底!’是我一直遵循的原则,也分享给想成功的每一个人。”

2018年,孙靖夷博士毫无悬念地入选由七天传媒出版社出版的《加拿大华人精英录》第一卷,相信每一个读到他故事的读者都会为他的敬业、勤奋、高产而折服。

2019年,孙靖夷博士获得由七天传媒主办的“华裔之光”奖。

▲2018年6月22日,孙靖夷与夫人在七天传媒主办的《加拿大华人精英录》首发式“星光耀蒙城”活动现场。(图片来自加拿大七天)

(原标题:孙靖夷:人工智能领域的开拓者)

来源: 加拿大七天

安卓用户,可在各应用商店搜索下载华舆APP(中新社旗下新媒体平台),关注全球华侨华人,浏览世界各国媒体新闻资讯,无需翻译——华舆在“手”,世界尽在掌握!