第四十一章 背后的影子

最新网址:m.kudushu.org
    第四十一章 背后的影子 (第1/3页)

    “根据一开始的猜测,我们曾假设三个案子之间是相互关联的,如果从这个角度入手,这个高手是谁,恐怕就不难猜了。”陈熙说道。

    “一个精通互联网技术的人…难道是冯明吗?他好像是科技公司的高管。”顺着陈熙的思路,唐语然大胆地猜测道。

    “没错,我们也是这么假设的,所以现在正需要搜集相关的证据,来验证我们的猜想。”

    “那需要我做什么呢?”唐语然开口问道。

    “我想请问,如果警方能够同时获取秦凯和冯明这两个人的聊天记录,你是否能判断出,他们一方的聊天对象,是否是另外一个人?”不答反问,陈熙将另一个问题抛给了唐语然。

    “能。”听了陈熙的问题,唐语然坚定地点了点头。“只要有足够的数据,这种事情是可以做到的。”

    “那具体的判断原理,你能讲一下吗?”

    “当然可以。”唐语然说完,先是顿了顿,接着说道:“其实原理很简单,也并不难理解。就像你刚才所说的,只要能够得到两人的聊天记录,收集上面的文本信息,就能对两人的语言风格和文本特征进行抽取,只要有了这些特征,就可以依据特征构造一个模型,说简单点,这个模型,就类似于一个模子。在这之后,如果想判断某一文本是否是由这个人所写成的,只要将文本内容的特征抽取出来,与已经成型的模型进行对比,得到一个相应的匹配度,就可以根据这个匹配度做出判断了。”

    “那么,按照你的意思,匹配度越高,文本出自同一个人之手的几率就越大,是吗?”听了唐语然的解释,陈熙不禁有些晕晕的,她只是听了个大概,但基本的原理她是听懂了。

    “没错,可以这么说,这种方法是讲究几率的,无法做到百分百的吻合,所以也只能作为参考。”

    “但如果匹配度很高的话,基本上也不会有什么问题了吧?”陈熙反问道。

    “理论上来说,是这样的,即便是有人刻意想仿造他人的风格,对文本内容进行造假,但这种东西,不是想造假就能造得出的,其中会牵扯到很多的因素,这其中的因素被我们称之为特征因子。如果模仿的不像,或是抓不住重点,反而会搞得不伦不类,计算机在抽取特征时,一下子便可识别出来。”

    “听起来很专业的样子,没想到你们研究的东西这么有技术含量。”陈熙不禁感叹似的说道。

    “没有那么夸张了,我在这一行,还只是一个小辈而已。”听了陈熙的夸奖,唐语然一下子有些不好意思了,连忙自谦似的说道。

    “你也不用谦虚,术业有专攻嘛,不过我还是想问,按照你的经验,这种计算机统计出来的结果,准确率会很高吗?”陈熙迟疑了一下,还是说出了心中的顾虑,毕竟查案这种事,来不得一点马虎。

    “我明白你的顾虑是什么,不过我很负责任地告诉你,我刚才所说的这种利用文本特征来侦破破

    (本章未完,请点击下一页继续阅读)
最新网址:m.kudushu.org