当前位置: 首页 > 资讯攻略 > IT资讯 > 科大讯飞参加ICPR 2018 MTWI再显雄厚实力

科大讯飞参加ICPR 2018 MTWI再显雄厚实力

来源:互联网 分类:IT资讯 发布时间:2018-08-23 11:50:37 访问量:
近日,在第24届国际模式识别大会(ICPR 2018)举办的MTWI图文识别挑战赛中,科大讯飞与中科大语音及语言国家工程实验室联合团队以绝对实力包揽了全部三项任务的冠军,进一步彰显了科大讯飞在图文识别技术上的业界领先地位。

国际模式识别大会(International Conference on Pattern Recognition, ICPR)起始于1972年,是国际模式识别联合会(The International Association for Pattern Recognition, IAPR)组织的模式识别领域的旗舰级学术会议,今年是ICPR创办40余年来第一次走进中国内地。

科大讯飞深耕智能语音与人工智能技术研究和发展已有十九年,在语音合成、语音识别、口语评测、语言翻译、声纹识别、人脸识别、自然语言处理等智能语音与人工智能核心技术上代表国际最高水平。此次,科大讯飞包揽ICPR 2018 MTWI三项冠军,证明科大讯飞不仅在智能语音上国际领先,在计算机视觉领域也具有雄厚实力。

 

 

科大讯飞参加ICPR 2018 MTWI再显雄厚实力

关于ICPR 2018 MTWI

本次MTWI(Multi-Type Web Images,多样式网络图像)识别挑战赛由模式识别领域的国际盛会ICPR举办,吸引了三星中国研究院、商汤科技、网易、清华大学、北京大学、中科院等众多产业界和学术界的著名研究机构参与。

此次比赛共分为三个子任务:

任务一(文本行识别)要求参赛者识别出给定的文本行图像中的文字;

科大讯飞参加ICPR 2018 MTWI再显雄厚实力

任务二(文本检测)要求参赛者在给定的网络图像中检测出文本行所在的位置;

科大讯飞参加ICPR 2018 MTWI再显雄厚实力

任务三(端到端文本检测和识别)则需要同时对文本行进行检测并识别。

科大讯飞参加ICPR 2018 MTWI再显雄厚实力

MTWI挑战赛使用的数据集是由阿里巴巴收集和标注的淘宝商品类图像,其中训练集和测试集各有一万张图像,每支参赛队伍有三次机会提交测试集的测试结果,由比赛举办方评测得分,并按照每支队伍的最优成绩排名。

科大讯飞参加ICPR 2018 MTWI再显雄厚实力

数据集示例

用新的算法应对新的难题

作为亚太地区最大的智能语音与人工智能上市公司,科大讯飞不仅在智能语音、自然语言处理等领域硕果累累,也在图文识别领域深耕多年,并成功将文字文档识别技术应用在移动终端输入法、教育考试、司法辅助等领域。为了在其他场景中验证图文识别技术的有效性和领先性,科大讯飞与NELSLIP(National Engineering Laboratory for Speech and Language Information Processing,中科大语音及语言国家工程实验室)的杜俊教授、戴礼荣教授团队联合参加了此次场景更为复杂多变的MTWI识别挑战赛。

科大讯飞在图文识别领域的多年经验主要集中在教育、司法、输入法等场景下,已形成一套完备的基于深度神经网络模型的文档图像分析识别的系统。然而,与这些应用场景不同,网络图像识别的主要难点在于其字体变化多样、存在几个到几百像素字号、多种版式,并且还包含较多干扰背景。另外,在本次比赛中,相较于英文和其他字符,结构更复杂的汉字占很大比例,且统计发现在训练集中有75%的汉字出现不到50次,这无疑给识别和检测都带来了很大的困难。

针对上述现象,在识别任务中,科大讯飞与NELSLIP联合团队基于Encoder-Decoder思想,提出了一种新的结构分析算法,该算法将中文拆成多个部件、英文单词拆成单个字符后借助Attention进行识别,在准确识别出多个部件后再利用动态规划策略进行重组,从而得到最终的输出结果,这种依赖分析结构的方法,可以有效地解决字体多样、结构复杂带来的识别率低下的问题。除此之外,还使得模型具备了识别低频词和集外词的能力。在检测任务中,为了解决文字尺度变化大、文本行朝向不一致的问题,科大讯飞与NELSLIP联合团队对输入图像构建空间金字塔,在各个尺度上预测各种朝向文本行所在的任意四边形的顶点,从而完成文本行的准确定位。

技术早已应用在现实

在手写识别应用方向,科大讯飞AI研究院图文识别团队具有行业内领先的在线和离线手写识别系统,可以进行中文、英文、数学公式等多种应用场景下的在线和离线文字字符识别,相关的技术已经成功在讯飞输入法、教育评测、智能辅助评卷等应用场景获得实用;面向公检法等应用场景的文档图像分析与识别系统,目前也已经在自动编目、辅助判案等场景、智慧城市中的文档信息结构化处理等应用场景获得实用。

在科大讯飞的讯飞语记、讯飞阅读、讯飞有声等app中,也有图文识别系统的应用。日常的工作学习中,纸质文献、PDF、老师板书等再也不需要拍下来再逐字敲进文档,比如用讯飞语记就可以将图片中的文字直接转成可编辑的文本,大大提高工作学习效率。

计算机视觉的发展,特别是文档图像的分析与识别应用,和智能语音、智能交互、数据信息分析等多方面的综合应用一样具有十分广阔的前景。未来,相信科大讯飞能够通过的“平台+赛道”的AI落地战略,通过讯飞开放平台,将各项AI能力更好地为改变信息的交流以及互联互通,创造更大价值。

相关下载 +
全新上架 +
最新资讯 +
  • 汉化版游戏大全中文版大全
    汉化版游戏大全中文版大全 汉化版游戏有哪些好玩的?不少玩家想找一些汉化版的手机游戏进行体验,优装机下载站小编就给大家带来汉化版游戏大全中文版大全,这里全部都是十分优质的汉化版手机游戏,游戏类型丰富多样,可供玩家自由选择,这些游戏都是国外非常火爆的手游,游戏界面和字幕都是汉化过得,玩家可以轻松体验游戏乐趣,这些游戏免费即可安装,感兴趣的朋友不妨来下载试试看。
  • 射击游戏内置功能菜单大全
    射击游戏内置功能菜单大全 射击类内置菜单的游戏有哪些?不少玩家想找一些内置菜单版的射击游戏进行体验,优装机下载站小编就给广大玩家们带来射击游戏内置功能菜单大全,这些游戏都是经典耐玩的射击类手游,在这些游戏里玩家可以自由修改参数,实现无限子弹和无限武器,游戏中的玩法十分精彩热血,玩家使用各类武器在游戏里战斗冒险,对这些游戏感兴趣的朋友不妨来下载试试看。
  • 可以招降武将的三国游戏
    可以招降武将的三国游戏 可以招降的三国游戏有哪些?什么三国手游中玩家可以招降武将角色呢?优装机下载站小编就给玩家们带来可以招降武将的三国游戏,这些游戏里汇聚了丰富的武将角色,玩家需要在游戏里将这些武将打败之后才能收服,游戏玩法十分精彩热血,并且非常考验玩家的策略能力,这些游戏采用经典的三国历史故事,给大家带来十分丰富的游戏体验,对这些游戏感兴趣的朋友不妨来下载试试看。
  • 好玩的机甲类游戏有哪些
    好玩的机甲类游戏有哪些 好玩的机甲类游戏有哪些?机甲类的游戏一般以战斗类的比较多,这一类的游戏画面感很好,充满了未来的科幻气息,游戏非常耐玩,无论是男生还是女生都很很适合玩。小编给大家特意整理了这个2024机甲游戏排行榜,在这个榜单中看到的机甲游戏都是新出的一些机甲类游戏,充满了新鲜感,赶紧来了解一下吧。
  • 热门的avg冒险游戏有哪些
    热门的avg冒险游戏有哪些 热门的avg冒险游戏有哪些?avg游戏比起其他的游戏充满了不确定性,游戏中有很多未知的因素等待着你去了解,这一类的游戏可玩性还是很高的。如果你对冒险游戏很感兴趣,那么这个2024热门的avg游戏排行榜就是你千万不能错过的了,这里的游戏都是小编精心挑选的,很多的挑战等着你来完成。
  • pve手游排行榜
    pve手游排行榜 好玩的pve游戏都有什么?pve类的游戏可以让玩家与游戏中设定好的boss或者是NPC来进行战斗,pve类的游戏玩起来还是很有特色的。那么哪些pve游戏比较值得下载呢?小编给大家专门整理了这个pve手游排行榜,在这个榜单中看到的pve游戏都是可玩性比较高的,相信大家都能在这里找到令自己喜欢的游戏。

今日更新 网站地图 排行榜

优装机下载站(https://www.uzhuangji.net/)版权所有(网站邮箱:gua_niu66@163.com)陕ICP备2024030148号-1

本站资源均收集整理于互联网,其著作权归原作者所有,如果有侵犯您权利的资源,请来信告知,我们将及时撤销相应资源。