专利信息学
什么是专利信息学
专利信息学,指的是利用计算机方法对专利信息进行分析,从而发现若用逐篇专利文献分析可能难以看出的那些关系和趋势的一门科学。
这个术语的含义包括了以下各种形式的专利信息分析:
◆专利情报——利用专利信息来确定某机构的技术能力,并利用该情报来制定技术发展战略中的策略;
◆专利地图——有时也称之为空白区域图,它是利用已公开的专利数据绘制出与特定主题或新发明相关领域的可视化图表等;
◆专利引证分析——在相同或完全不同的市场空间内,基于某机构的专利被另一家公司引证的情况进行的专利引证关系研究,其目的是为了大致确定专利的价值,或者更确切地说,确定潜在的许可伙伴或线索。
此外,专利信息学还包括对所获取的各种专利信息、专利情报等的深人分析和应用。
从上面的定义可以看出,这一概念至少包括了两层含义:一是对海量信息的收集和整理,也就是管理好这些数据;二是要通过分析发现在表象掩盖下的事实和规律,也就是用好这些数据。
专利信息学原理
当我们对专利信息学进行更详细的探讨时,可以将不同的分析方式划分为两大类,即:数据挖掘(datamining)和文本挖掘(textmining)。
数据挖掘,是指从划定域内的数据中抽取出有用的信息并对其进行分析。通常,这意味着对专利中所包含的著录项目信息进行分析。比如说,有人可能想考察某一特定技术领域专利权人和国际专利分类号(IPC)之间的关系。挖掘或描绘该信息可得知这一技术领域内的主要参与者以及他们通常所关注的具体技术内容。如果使用德温特数据的话,还可以用德温特手工代码代替IPC来进行类似分析。
文本挖掘或绘图,一般涉及在所包含的主要技术构思的基础上将文件分类。其数据源是未经过组织的文本,它没有被结构化,这些材料唯一的结构来自于作者撰写它们时所采用的方式,以及他们在不同的构思和概念之问如何建立起一种联系。比如说,你可以收集某一特定专利权人的所有专利文献,并对这些文献的文本进行分析。在一幅聚类图中,借助计算机软件可以从这些文献中提取出主要的构思,并根据这些构思将文献分类。之后,计算机软件还可以通过某种方式将这些聚类可视化,绘制成图。通过观察这些聚类(以及随后考察涉及的文献本身,当然这时文献是以某种方式组织过的),可以很快得知某机构所从事工作的概况,以及这些工作在内部是如何关联的。
进行数据挖掘或文本挖掘的效果如何,通常取决于分析员对所分析的数据源的熟悉程度,例如对数据的结构、内容、具体项目的含义等的了解,以及制作和分析这些数据的方法。数据挖掘或文本挖掘得越成功,所获得的有用信官、和情报就越多。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请您通过400-62-96871或关注我们的公众号与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~