技术文章及通讯

基于深度学习的手写体日语汉字分类

作者:MathWorks Staff


Humanities Open Data Shared Use Center.

" data-toggle="lightbox" class="add_margin_0 ">日文经典文字数据集(国作健休其他收集/ CODH处理)。

日文经典文字数据集(国作健休其他收集/ CODH处理)。所提供的人文开放数据共享使用中心

图为江户时代(1603-1868年)日本手稿中的100个汉字。乍一看,它们就像涂鸦。也许如果这些字符在句子中,就有可能通过上下文来识别它们。但是,一个深度学习网络能够完全通过它们来识别字符吗?MathWorks的顾问Akira Agata训练了一个卷积神经网络(CNN)来做到这一点。Akira将CNN与之前从未遇到过的字符集进行了测试。他的网络仅用几行代码就达到了90%以上的准确率。

来看看Akira是怎么做到的吧:使用CNN对古日文进行分类

发布日期2017 - 93167v00

查看相关功能的文章