第8章 算法优化,周晓彤的突破(1/2)
2021年12月的深夜
推开研发部的门,一股混合着咖啡香和泡面味的气息扑面而来。
老李靠在椅背上,眼睛盯着屏幕,手指却在无意识地敲击桌面,显然已经疲惫到了极点;
几个年轻的研发工程师趴在桌上睡着了,电脑屏幕还亮着密密麻麻的代码;
周晓彤坐在最里面的工位,背影单薄,头发凌乱地贴在脸颊上。
双手撑着额头,肩膀微微颤抖。
桌角堆着空咖啡杯和没吃完的面包。
“晓彤,先休息会儿吧。”我轻声说。
周晓彤猛地抬起头,看到是我,眼神里闪过一丝慌乱,连忙用手背擦了擦眼睛:“刘总,您怎么来了?我没事,再试试就能突破了。”
我拿起她桌上的水杯,去茶水间给她倒了杯温水。
“喝口水,别硬撑。团队已经连续加班两周了,大家都累坏了,再这样下去,不仅效率低,还容易出问题。”
周晓彤接过水杯,抿了一小口,眼泪还是忍不住掉了下来。
“刘总,对不起,我辜负了您的期望。我们尝试了各种优化方案,调整了LSTM模型的参数,补充了场景化特征,但准确率就是卡在89%,误判问题还是没完全解决。”
她指着屏幕上的误判案例:“您看,这个案例是一位老人接到保险公司的续保提醒,对方提到了‘转账’‘账户’,语气也比较急促,AI还是误判成了诈骗电话。我们的模型还是分不清这种‘正常业务中的敏感词汇’和‘诈骗中的敏感词汇’。”
我看着屏幕上的语音波形图和特征分析,心里也有些着急。
公安部门的试点测试定在下周,要是准确率达不到90%,不仅试点要推迟,企业定制版的合作也会受影响。
看着周晓彤疲惫的样子,我安慰道:“别急,技术突破不是一蹴而就的。我们已经离目标很近了,也许只是差一个思路转变。”
趴在桌上睡着的研发工程师小林突然惊醒,揉着眼睛说:“周姐,要不我们放弃规则引擎吧?说不定是规则和模型冲突了。”
“不行。”
周晓彤立刻反驳,“规则引擎是基于公安的诈骗场景库设计的,能精准匹配‘索要银行卡+要求即时转账’的核心场景,要是去掉,误判率会更高。”
“大家先回去休息吧,明天再接着干。”
我对众人说,“身体是革命的本钱,今晚好好睡一觉,说不定明天就有灵感了。”
老李站起身,伸了个懒腰:“刘总说得对,我们现在脑子都僵了,休息一下反而好。晓彤,你也别熬了,一起回去吧。”
周晓彤摇摇头:“你们先回,我再试试。”
我知道她的脾气,决定的事情就不会轻易放弃。
等其他人都走了,我坐在她旁边的工位上:“我陪你。”
周晓彤惊讶地看着我,眼眶又红了:“刘总,您不用陪我,您明天还有很多会要开。”
“没事,正好我也想再看看这些误判案例。”
我打开电脑,调出之前的测试数据,“你有没有想过,也许不是模型和规则冲突,而是我们的特征提取不够精准?LSTM擅长提取序列特征,但对语音的局部特征捕捉不够,比如语气中的‘细微情绪变化’——诈骗电话的急促里带着‘胁迫感’,而正常业务的急促里没有。”
周晓彤眼睛一亮:“您的意思是……我们可以引入其他神经网络来补充特征提取?”
“对。”
我点点头,“(卷积神经网络)擅长提取局部特征,我们可以把和LSTM结合起来。LSTM负责提取语音的序列特征,比如关键词出现的先后顺序;负责提取语音的局部特征,比如语气中的胁迫感、讨好感等细微情绪;再加上规则引擎的场景匹配,形成‘特征提取+场景匹配’的双重判定,这样应该能解决误判问题。”
本章未完,点击下一页继续阅读。