“人景分离项目……”
叶晓奇心说,来了,认真的聆听状,对这个项目非常关心。
“目前遇到了一些问题,主要是由于图片集数据量不够,导致我们的在此基础上建立的特征库,识别准确度非常低下。同时由于美工设计师的不足,在人工剥离人像上也显得资源缺乏。”
“唉……”
叶晓奇心里轻轻的叹了一口气,到此为止,最关心的两个项目,都遇到了各自的困难。一个是自身的不足,自动化基因缺乏。一个是世界性难题,深度学习需要海量的图片,世界各国的数据集都还在建,iage的数据集也还很弱小,中生代的勤工俭学数据集计划也才开展没多久。
“所以针对这两个问题,我们基础架构研部,一方面加大美工的招人力度,另一方面我们开辟了一个新的思路,那就是把包含人像的视频按帧拆分,作为我们的图片素材来源。”
“在此过程中,我们现,通过对眼睛特征和嘴唇特征的综合表现,可以计算出一个人的情绪;通过眼睛和嘴唇的连续变化,可以得到一个人的情绪变化指数;通过唇形的连续变化,可以大致的知道这个人说什么话……”
正在失望之中的叶晓奇,震惊的问道:“你是说,读唇?”
霍蓓蕾拨了拨梢,答道:“是这样的,没错,这将是我们后续的参考研方向。”
“你是说,因为相应的图片集不足,所以你们就把脑筋动在了视频上。然后,就得到了这个东西?”
霍蓓蕾点点头,“没错。”
叶晓奇却感到有些凌乱,科研树展基本方向不应该是这样的。
图像ai技术大展是建立在iage的深度学习理论的基础之上的,深度学习得到的特征库是一系列相关计算的核心,而深度学习依赖海量的图片。
所以图片不足,你们就特么去拆视频?拆视频就算了,美工不足所以你们直接就把人脸识别那套搬过来了,结果大把的资源撒下去,人景分离还是没整出来,却现了可以做情绪识别和读唇术?
这下总算知道刚刚香取绫汇报的大笔支出花在哪了……
真真的应了那句话:有心栽花花不开,无心插柳柳成荫
“准确率多少?”
任何图片项目都是有准确率作为标尺的,就以人脸识别来说,准确率低于5o的研究没有任何意义,商用阶段起码要拥有8o以上的准确率才行。
“情绪识别准确率高达64,主要包括哭、笑、怒、乐、难过、伤心等词缀,目前还在进一步学习,因为分类决策比较少,所以这个学习进展非常快。唇语识别,目前仅限于普通话中文,我们主要是采用央视某套有字幕的节目进行学习的,经测试,对特定的几个主持人的口型识别准备率接近74,而此类泛用视频的识别率……不足5……”
74……不足5……
情绪识别抛开不提,单说唇语识别。
74什么概念,就是一句话识别正确的字数到七成,就以“人类是低等植物”这几个字来说,可能意思完全相反,但是对人类来说,猜到它的正确意思一点困难都没有。而实际错误生的地方都是随机的,也不一定会错的这么离谱,比如“黑灰花卉会挥”这句话,就如同正常人笔误一样。
叶晓奇不禁为那几个主持人感到默哀,估计他们要是知道他们说的话被天网研究透彻到了这个地步,以后路过中生代都会远远的绕道走。
当然只针对这几个人的研究是没有意义的,所以才有泛用的说法。
泛用识别率不足5,听起来似乎不那么靠
第258章 无心插柳柳成荫[1/2页]