亲,双击屏幕即可自动滚动
正文 第5章 反诈AI原型,首次测试
    “所有设备调试完毕,模拟诈骗电话数据集已加载,包含公检法办案、低息贷款、中奖兑换三类高频场景,共1000条测试样本。”

    

    周晓彤额前的碎发被汗水濡湿,贴在光洁的额头上。

    

    她面前的屏幕分成两栏,左侧是模拟来电的语音流,右侧是AI实时分析结果,LSTM模型的输出数据每秒刷新一次。

    

    “启动测试。”

    

    我话音刚落,周晓彤按下了启动键。

    

    实验室里瞬间安静下来,只剩下设备运行的轻微嗡鸣和模拟来电的语音播报。

    

    第一条测试样本是“公检法办案”场景:“您好,这里是市公安局经侦大队,您的银行账户涉嫌洗钱犯罪,请立即将资金转入安全监管账户……”

    

    屏幕右侧实时跳动着分析结果:“关键词匹配:公检法办案(权重85%)、涉嫌犯罪(权重79%)、转账(权重92%);

    

    语气特征:急促(置信度88%)、威胁(置信度91%);

    

    综合判定:诈骗电话(置信度93%)”

    

    “识别成功!”

    

    小陈低声欢呼。

    

    周晓彤紧绷的脸上露出一丝笑意。

    

    接下来的十几条测试样本都顺利通过,低息贷款、中奖兑换等场景的识别准确率基本稳定在85%以上。

    

    张雪薇在笔记本上快速记录,“照这个趋势,准确率突破90%没问题。”

    

    第23条测试样本模拟来电是保险推销:“您好,请问您近期有购买重疾险的需求吗?我们公司推出一款新产品,缴费低、保额高,现在办理还能享受额外福利……”

    

    屏幕上的分析结果显示:“关键词匹配:福利(权重62%)、办理(权重58%);

    

    语气特征:讨好(置信度76%)、急促(置信度69%);

    

    综合判定:诈骗电话(置信度71%)”

    

    “误判了!”

    

    老李猛地拍了下桌子,“这明明是正常推销,怎么会判定成诈骗?”

    

    两个小时后,测试结束。

    

    屏幕上显示最终数据:模拟诈骗电话识别准确率78%,误判率高达15%,其中80%的误判来自正常推销、服务类电话。

    

    “78%……”

    

    张雪薇的脸色沉了下来,合上笔记本。

    

    “刘总,这个结果离市场推广的要求差太远了。红杉那边明确表示,准确率至少要达到90%才会考虑投资,而且我们和广州公安约定的试点测试时间只剩1个月了,现在这个状态,根本没法推进。”

    

    老李揉了揉太阳穴,语气急躁:“问题出在算法上!现在的模型只看词汇和语气,正常推销和诈骗电话的特征太像了,都是频繁用‘福利’‘办理’‘转账’这些词,语气要么讨好要么急促,AI根本分不清。我建议加大训练数据量,把推销电话和诈骗电话的特征做更细致的区分。”

    

    “不行,时间来不及了。”

    

    周晓彤突然开口,,“现在离试点测试只有1个月,重新收集、标注大量数据至少需要2个月,而且就算数据量上去了,词汇和语气的本质相似度还在,误判问题还是解决不了。”

    

    “那你说怎么办?”

    

    老李看向她,“总不能眼睁睁看着项目卡在这里吧?”

    

    周晓彤走到屏幕前,调出误判案例的分析报告:“你们看,这些误判的正常电话,虽然有类似诈骗的词汇和语气,但都有一个共同点——没有索要核心敏感信息,也没有明确要求即时转账。比如保险推销,只是介绍产品,不会问银行卡号;银行提醒,只是告知升级,不会让立刻打钱。”

    

    她顿了顿,指尖指向屏幕:“而真正的诈骗电话,不管是公检法办案还是低息贷款,最终都会落到‘索要银行卡信息’‘要求即时转账’这些核心行为上。我们的模型现在只关注表层的词汇和语气,忽略了场景化的深层特征,这才是误判的核心原因。”

    

    老谭点点头:“晓彤说得有道理。诈骗的本质是骗取财物,所以‘索要敏感信息’‘要求转账’是不可缺少的关键环节。正常电话就算语气、词汇相似,也不会涉及这些核心行为。”

    

    “那优化方向就明确了。”

    

    我站起来,“在现有LSTM模型的基础上,补充场景化特征维度。”

    

    走到周晓彤身边,看着屏幕上的模型架构图:“这个优化方案的技术难度不大,核心是特征工程的补充和判定逻辑的调整。晓彤,你之前负责语音分析模块,对模型最熟悉,这个优化任务就交给你牵头,老李协助你处理数据标注,老谭负责确保优化后的模型不影响数据安全。”

    

    “我没问题!”

    

    周晓彤立刻答应,“我今晚就开始梳理场景化特征库,明天和老李对接数据标注,争取一周内完成模块开发,两周内完成内部测试,剩下的时间做整体调试。”

    

    “刘总,1个月的时间还是太紧张了。”

    

    张雪薇担忧地说,“就算优化完成,准确率能突破90%吗?如果达不到,融资和试点都会受影响。”

    

    “没有退路,必须达到。”

    

    我扫一眼在座的人,“现在不是纠结能不能成的问题,而是必须成。张雪薇,你这边同步和红杉沟通,争取把面谈时间推迟两周,为研发团队争取更多缓冲;同时对接广州公安,获取更多真实诈骗案例的场景化数据,协助晓彤他们优化模型。”

    

    “好,我现在就去联系。”

    

    张雪薇点点头,立刻拿出手机开始打电话。

    

    我走到窗边,看着楼下川流不息的人群。

    

    “刘总。”

    

    周晓彤走过来,手里拿着一张纸,“这是我初步梳理的场景化特征库,包含28个敏感信息关键词和16个转账要求关键词,你看看有没有遗漏。”

    

    我接过纸,上面的字迹清秀工整,每个关键词都标注了权重和出现场景。

    

    “‘安全账户’‘资金监管’这些诈骗常用的表述,也要加进去。”

    

    我指着纸说,“还有,有些骗子会用隐晦的说法,比如‘把钱打到指定账户’‘提供你的支付信息’,这些也要纳入识别范围。”

    

    “好,我马上补充。”

    

    周晓彤认真记录下来,转身回到工位。

    

    晚上十点,研发部依旧灯火通明。

    

    “大家早点休息,明天再接着干。”

    

    我走进实验室,对他们说。

    

    “刘总,我再梳理完特征库就走。”

    

    周晓彤抬头,眼里布满红血丝,但精神依旧饱满。

    

    “别熬太晚,身体要紧。”

    

    我拍拍她的肩膀,“优化任务虽然紧急,但也要循序渐进,我们要的是质量,不是单纯的速度。”
为您推荐