聊一聊自然语言语义在专利检索中的多样化应

在今年,人工智能热度已经明显下降了。一方面是技术发展到了瓶颈,未有明显突破。另一方面,在实际应用场景应用中已经得到了一定普及。不在是象牙塔尖的存在,缺少了足够的动能。那么我们今天看看在专利检索中,自然语言语义解析查询这个应用场景中的实际应用现状,不足,改善和未来。

现状

目前市场提供的专利检索产品中还都是以传统的方式来检索,专业使用者则利用复杂的公式进行专利的信息检索。虽然各家产品也都提供了语义检索功能,但从实际使用者反馈来看,还都还差强人意。在似是而非的结果中,感觉还是未达到自己预期的结果,总体命中率在70%左右。这样的一个准确率刚好如鸡肋一般,食之无味,弃之可惜。

总结下语义查询的特点,优势在于使用简单、快速,效率超高;结果中有一定比例是语义相近信息。因此在粗查和概要性了解的时候较为实用。可以很快了解专利库中有多少专利类似的相关信息。劣势在于一次结果只能减量过滤,不能优化调整,人工无法干扰结果。因此在二次检索,深入检索的时候无法提高检索精度,对于遗漏的可能存在专利信息无法检索展现出来,对于专利查新这种重要行为,几乎是致命的打击。因此从业者也失去了对人工智能,语义检索的信任,还是更多依赖人为的传统检索来达到目的。

不足

我们再来了解下自然语言,人工智能技术领域的发展。自从bert模型横空出世,在自然语言解析这提升到一个新的高度后,在没有新的技术理念发布,都是在主分支上提出的,蒸馏、剪枝等技巧,从模型优化的角度提高精度,提高速度,减少冗余参数。各种分支模型虽然内卷的厉害,但还是没有从质方向上有变化。

在bert家族中,包括RoBERTa、XLNet、RoBERTa-wwm-ext、DistilBERT、这些模型可以从网上直接下载并应用,但是这些模型的训练数据主要为开放性数据,对于普通对话或者文本表述方式较为友好,对于专利特性的语言则达不到预期。

蓝灯鱼语义检索基于万的中国专利摘要数据进行训练的FISH_patent_ext则对专利语言特性效果则表现更好一些。但是从实际反馈来看也未达到客户预期,那么问题出在哪里。

在已有技术和专利检索的应用场景中,我们应该如何提升检索质量呢?

改善

充分了解客户的使用习惯,对输入数据行跟踪归类,从产品设计和技术架构调整都要做颗粒度更细致考量。在bert模型中可以支持一下几种功能,分别是文本分类、文本摘要提取、文本蕴含关系(问答)、文本生成这几个主要作用。这其中在大多数产品应用中只用到了文本分类这个功能,主要原因还是开源网站上有现成的代码,开箱即用,应用可以看到一定效果,并且应用场景最为广泛,上手比较容易。

但是弊端也比较明显,就是开元模型只能做些微调训练,并不适宜专利语言特点检索。要想获得更好的效果就要从最底层上训练一个基础模型,如蓝灯鱼用万的专利摘要数据,内存需要G,训练周期要20天。但这样具有行业特点模型并不会发布在网上开源中下载,这也是同样一段摘要语义检索中,蓝灯鱼语义模型精度略高的原因。

从使用的角度来讲,bert模型的局限也是显而易见的。如果要获得比较好的检索结果是需要客户输入一段已经写好的摘要内容去查询,这样的命中率会更高。然后在通过存量数据的关键字过滤,基本上都会有几条用户预期的数据展现出来。这里就需要产品去设计更好的客户过滤体验,才能达到预期检索数据。

当然这是比较理想的检索方式,但在实际使用中,使用者并不会输入一段完整的摘要文本,大多数是输入专利的技术交底书,或者使用者从技术交底书里面提出来的关键字。而这两种方式都不是模型预期的输入内容,因此在检索结果的命中率成断崖式下降。在模型技术已成固化的前提下,就要做使用模型的前后工程,前工程处理文本成为使用模型输入的文本要求,后工程处理检索记录过滤数据和合理排序。

在前工程中,产品设计首先要根据客户的输入内容进行判断,提供交底书输入框,如果字数达到字以上就要利用人工智能模型的概要抽取,提取最为重要的表达逻辑。由用户确认再进行检索。对于使用者的连续关键字,提供模型生成摘要文本,由使用进行选择或微修改后再进行检索,达到模型适应的文本查近似文本,命中略都会大幅度提高。

在以上两个输入场景中,前工程中要做好纽带作用,客户使用习惯和模型适配之间继续做颗粒度更细致研发。也就是bert模型不只要提高文本分类精度,还要提高摘要抽取能力、语义文本生成能力。三个模型方向都要进行研发,从而提高总体查询精准度,这还是有相当大的难度,需要不断的投入硬件设备和AI研发力量。

后工程主要对结果的自定义过滤,优化已有结果排序。

未来

蓝灯鱼的语义检索的目标是致力于减轻传统查询的工作量,和降低初级使用者的门槛。虽然并不能取代人工查询,但仍然可以突破目前功能鸡肋的状态。就目前蓝灯鱼NLP语义研发成果来看,文本分类、摘要生成、核心概要提取三个核心要素都可以基于FISH_patent_ext模型文字转化。对于未来语义检索,蓝灯鱼仍然在人工智能方向投入更多的精力,以区别传统检索方式的产品上发展。

以下是展示语义生成摘要例子

举例一

关键字:汽车,锂电池,充电快,耗电慢,安全,防火

摘要内容:1.汽车锂电池充电快耗电慢安全防火装置,其特征在于包括快安全报警单元,控制电路及电源电路,省电电路。当电机正常运转时,电流通过导线引流到快安全报警单元,快安全报警单元显示白号,当电机停电时,电量饱和导线断裂,停止引流到回路中,快安全报警单元控制快安全防火单元短接。快安全报警单元为继电器控制的单元,其供电回路中串联一个继电器。本发明与单片机控制相比安全、可靠、成本低。2.汽车锂电池充电快耗电慢安全防火装置。本发明公开了一种具有全波整流稳压结构的交流稳压型差速断路器,主要由快速切换触头、整流器、放大器、控制电路、过压保护电路等组成。快速切换触头将交流稳压型差速断路器的输入与输出端分别分别分接整流器的正极与负极,从而构成超多路充电回路;控制电路根据直流偏压值进行选频,从而在超多路充电回路中选择相应的充电回路输出与直流高压侧电弧切换触头相连接的电压脉冲;放大器对高压脉冲进行放大,以此判断电弧电压是否超出设定的范围,并在保护范围内切断电源。3.汽车锂电池充电快耗电慢安全防火应用的控制方法,可以实现电动汽车充电的快、慢、防火的自动控制,尤其适用于电动自行车。控制方法采用继电器控制汽车的电瓶实现充电功能,其余电器是常用的汽车用电器;控制方法采用了红外传感器、超声波探头、手动延时器、拨码开关等部分功能,其他常用的汽车用电器则是常用的发烟器。4.汽车锂电池充电快耗电慢安全防火装置,属于汽车领域。汽车充电桩前方设有充电桩接触消磁装置,充电桩接触消磁装置连接有电线,电线另一端连接保护机构,保护机构连接接地线。本实用新型在出现局部触电、火灾等紧急情况时,能够有效地将电动汽车在出现局部放电过程中释放的大量热量吸收,防止局部发生带电火灾,保障人身安全,同时在电量不足时,也能以尽快毁坏汽车车体的短路保护措施为目的,尽快将汽车车盖打开,提高车辆自救的安全系数。5.汽车锂电池充电快耗电慢安全防火装置,属于汽车、电动自行车、无人驾驶等领域。该装置改变原有的电表控制器的方式,当车辆发生异常停车、道路过低时,三个红外线接收器即开始发射,电动车及时将车载蓄电池充电,然后由辅助电源线将蓄电池连接,将停车位车内的电动车及时启动单向阀,经车载蓄电池和监控摄像头的配合自动地将危险信息传输给汽车控制器,并由汽车驾驶员作出判断,有效地防止事故的发生,具有结构简单、有效,建设容易,安装方便,性能可靠,性价比较高等特点。6.汽车锂电池充电快耗电慢安全防火插头,在电动汽车充电器总成上增加了一个可插入充电电池的插头,还增加了一个2级陶瓷电容,可以先对充电电池进行恒压充电,然后再进行低压充电,这样充电电压稳定不升,避免电池饱和,延长电动汽车充电器的使用寿命。可选择地安装在汽车发动机各类电器插接口上。它具有结构简单、使用方便、防火性能优良、安全性能高等特点。7.汽车锂电池充电快耗电慢安全防火装置,涉及电动汽车及其类似设备技术领域。它解决了目前燃油发电机组在快速充电过程中,有时会出现火花甚至出现送电信号故障的问题。它包括端盖、进油管、出油管、活动导板i、连接管i、连接管ii、充电机、外壳和控制器。其特征是端盖与进油管通过连接管i连接,出油管与活动导板ii通过连接管ii连接,连接管i和连接管ii与外壳通过螺栓连接成一体。本实用新型可以取代将燃油发电机组的主机结构降低外观尺寸,并且同现有技术相比成本大大降低。8.汽车锂电池充电快耗电慢安全防火系统,其特征在于,包括有串联在直流输出过流通路中的电压采样电路,当低压直流输出电压低于参考电压时,所述电压采样电路接收到交流电源正极或负极的电压信号后,将所述电压信号输送到放大电路中,经放大器滤除直流侧电压和交流侧电压,然后输出到a/d转换器,通过减相器转换为直流输出电压,接着再经过稳压管将稳压管导通,使得所述直流输出电压和交流侧电压相等,该技术方案相比现有技术能耗低,抗干扰能力强,安全可靠。9.汽车锂电池充电快耗电慢安全防火装置属于汽车电器技术领域。本实用新型采用在进汽车的发动机上增加一个复归装置,该装置的触发端电路与熄火报警段电路串联,不但可以在发动机出现系统故障引起熄火时,及时使火花塞断电使发动机熄火,有效限制电池的过充反应,延长了发动机的使用寿命。

举例二

关键字:本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。

摘要内容:1.本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。采用氯化亚锡作为包覆材料,降低了石墨烯在电解液中的溶解度,增强了其包覆性能,采用氯化亚锡包覆材料作为电极材料,降低了石墨烯的极化,提高其电化学性能。材料的改性可以使电池的倍率性能更加显著提高,材料单位的容量、循环性能、倍率性能也得到提升。材料微观形貌的改善大大缩短了材料的改性周期,大大缩短了锂离子电池的生产周期。2.本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。将石墨烯包覆的锂离子电池电极材料的内部进行电化学处理之前,先进行石墨烯的包覆,可以使电化学处理过的外部具有一定的机械强度,克服了石墨烯包覆强度较弱的缺点,可以有效避免隔膜开裂的现象;以及隔膜周边处的石墨烯会与锂离子通道发生化学反应,而与锂离子扩散进行化学键合反应,降低锂离子电池的内阻,从而大大提高电极材料的稳定性能。此外,通过电化学处理之后,得到的石墨烯层活化温度较低,可使得锂离子电池的大倍率充放电循环性能优良。3.本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。其为不同粒径的非连续石墨烯颗粒经改性后,通过掺杂石墨烯能有效提高电解液电池阴极材料的导电性,另外,也使得离子电导率和倍率性能有所提高。本发明所述的非连续石墨烯包覆的锂离子电池电极材料可以通过原位复配将石墨烯修饰到聚集区域增加,进而提高材料的倍率性能和倍率性能。4.本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。采用水热法制备了表面包覆有锂离子的石墨烯包覆的负极材料。该材料具有较高的比容量和良好的循环稳定性。适合用于制备锂离子电池。本发明中采用水热法制备的石墨烯包覆的负极材料具有制备工艺简单、比表面积大、制备成本低的特点,易于商业化应用。5.本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。在基于核心材料的制备过程中,将水溶性的镁盐与锂源混合,利用镁盐将镁盐成为包覆水溶性的镁盐之后,再往其与溶剂中与非水反应,制得镁-水溶性镁盐包覆型锂电池负极材料,所得材料分散均匀,析出的极化量均匀,无沉淀等异常现象,制得的负极材料具有高的比容量与良好的循环性能,有效的防止电解液浸矿,解决了锂离子电池负极材料在高温高压下析出度差的问题。6.本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。材料具有钙钛复合材料、氟材料和多孔石墨烯等多种功能材料,具有规整的构型,并且制备方法简单,得到的钴/钙钛复合材料表面包覆有一层多孔石墨烯层,提高材料的电化学性能。7.本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。通过改变mos预制件的制备步骤和mos预制件的制备工艺参数,在不影响电子导电性的前提下,大大提高了材料的导电性和比容量。同时通过多次施加包覆接枝剂,显著增加了材料的导电性和比容量。在生产非连续石墨烯负极材料的过程中,通过包覆接枝剂,可以大幅提高材料内部的导电性和比容量,且显著提高了材料的可塑性。8.本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。通过在电极料中使用非连续石墨烯包覆的多孔层状碳材料,制备了具有高比表面积及孔隙率的多孔石墨烯包覆锂离子电池负极材料,提高了材料的安全性。该材料制备工艺简单,成本较低,且具有高比表面积且具有良好导电性,作为锂离子电池负极材料具有较高的电化学性能。9.本发明提供了一种非连续石墨烯包覆的锂离子电池电极材料。本发明的锂离子电池电极材料制备过程中首先利用水热法制备氧化镍纳米颗粒,然后再利用磷酸三芳胺和磷酸二芳胺制备二氧化钛纳米颗粒,最后再利用这两种纳米颗粒制备镁包覆层。本发明通过水热法制备了一种合适的纳米颗粒,其内包覆镁层较少,质量稳定。通过调节水热反应温度和反应时间可以控制四氧化三锰包覆的镁厚度。四氧化三锰包覆的镁层较多,对锂源有较好的缓冲作用,大大提高了电池的放电效率。蓝灯鱼专利检索产品基于1.2亿+全球专利数据库,结合人工智能自然语言技术、定位并拆解技术特征,通过知识图谱进行上下位同义词扩展,最终提取出精准的检索关键词。同时支持关键词检索、字段检索和批量申请号(公开号)等检索方式,并提供专业的专利分析、趋势研判。

感兴趣的朋友们可通过蓝灯鱼网站


转载请注明:http://www.aierlanlan.com/rzgz/818.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了