西西河

主题:【原创】闲谈聋人用电话录言以及未来网络视频方式 -- deaf

共:💬20 🌺41
全看分页树展 · 主题 跟帖
家园 算法不难,关键是training data

也就是说要有合适的数据来train中文这个model。并且有比较好的分词词典。

比较好的是,建立一个网战,提供录音工具,大家自己录音,并且写上自己发音的文字信息。是否是普通话。是否带某地方口音。这样采集足够多足够好的数据之后,就可以train一个不错的模型了。

其实我一直想做这么件事情,不过一直没空做。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河