高新技术领域的创新发明在专利文献中涵盖90%以上,而我国专利文献分类所采用的国际专利分类体系,对多数企业的管理者或技术人员是一个陌生的领域,他们所熟知的是自己的产业和产品。如何推广专利分类,使之充分利用专利和专利文献,为企业的创新服务,是摆在我们面前的一个课题。该表是突破传统的专利分类领域里的狭隘性、技术局限性观点,推广国际专利分类(IPC)运用到高新技术产业和产品领域的一种尝试。
《高新技术产业与国际专利分类号(IPC)对照表》(参看样页)由高新技术产业类名、国民经济产业(行业)分类号、产业名称、IPC分类号、IPC类名说明和权重组成,按高新技术领域中所属的国民经济产业分类划分,对应出相应的IPC分类号、类名及其在高新技术领域中所占的权重值。可作为参考来统计高新技术产业和国民经济产业中的专利文献的IPC分类分布状态,也可以对高新技术产业信息建设提供帮助。
高新技术是一个动态的、相对意义上的概念。目前我国在高新技术产业界定上没有统一标准,各省市对高新技术产业领域划定也不尽相同,该表所采用的高新技术领域仅是其中的一种。
权重也称权值,一个指标权重的大小反映该指标在整个评价指标体系中的重要程度、权重越大说明其越重要。各分类号给予不同的权重,其目的就是区别各分类号专利文献在高新技术之间的占有率。权重的统计结果,可以表明它们所反映的专利文献分布状态。一般说来,哪一权重值越高,所反映的专利文献集中性就越强,就越有利于专利文献分类号在高新技术中的判定。
一、权重的计算
对于高新技术产业与国际专利分类号(IPC)权重的计算我们用以下三种方法:
1.课题分类法:
根据所给的高新技术产业和产品名称及说明(简称课题),从IPC分类表直接查找并确定该领域中的IPC分类号。也可以借助中国专利检索系统(CPRS)系统的主题词检索出的专利结果,用IPC分类统计功能,统计出有关的分类号,参考所给的相关度排出分类顺序。
如分类号与课题吻合或基本吻合的,权重值按100%计算,部分吻合的,先给出分类号,然后用“三段浏览法”或“主题词算法”算出权重比例。
2.三段浏览法:
在CPRS系统中用课题所属的IPC分类号检索,在其结果中,选初期、中期和近期的三个时间段中的各50篇专利,也可以选100篇以上或更多,浏览其中的专利名称和文摘,并排除与课题无关的专利,从而判断该课题的专利数量在该分类的三个时间段中的比例,取平均值计算出权重值。
用字母Y表示权重值;
用字母Z 表示平均权重值;
用字母N1表示所选的初期专利数量;
用字母N2表示所选的中期专利数量;
用字母N3表示所选的近期专利数量;
用字母M1表示已排除的分类号专利量;
用字母M2表示分类上一级的分类号专利量;
用字母X表示从所选专利数量中已被排除的与课题无关的专利量;
用字母β表示已排除的分类号和上一级的分类号的比例系数:

用字母ε表示副分类比例平均值;
平均值ε=第一副分类+第二副分类+.....第五副分类专利数量之和的平均值;
用字母α表示修正值系数:
修正值系数α= ε*(10% ~ 20%);
用字母k表示修正值:
修正值k=ε*α;
用字母Φ表示主分类和副分类的比例系数;
用字母θ表示主分类和副分类的比例系数+修正值;
比例系数θ=Φ+k;
权重值计算公式:

权重值Y = Z—β
为什么要加上θ 表示主分类和副分类的比例系数+修正值呢?
因为,基于权重值的计算以课题的IPC分类为统计对象,在一个IPC分类号下,既包含主分类也包含副分类数据,统计的分类基数有误差,而CPRS系统中没有选择主分类或副分类功能,所以,我们用EXCEL对在一个分类号下的主分类、副分类各有多少专利,进行了统计和数据分析,得出有关的比例系数+修正值的测试结果(见表1)。
通过测试和分析,明确和得到以下结果:
第一、 明确了用发明专利作为统计对象;
第二、 明确了用主分类下的专利数量为统计基数,如果作权重的分类号在检索的专利中为副分类,则用主分类和副分类的比例系数和修正值k补充;
第三、 比例系数是在主分类级中仅有该分类号和包括该分类号的整体分类号之间的专利数量之比;
第四、 修正值系数是主分类和副分类、副分类和副分类之间的相关度的参考值大约10%-20%。
3.主题词算法:
在CPRS系统用课题所属的主题词检索,其中,主题词放在“标题+权利要求”中检索。在主题词的选择上,尽量扩大同义词、近义词的范围。
公式:

用以上三种方法得出的权重值的划分和选择范围:
(5%-20%)=20%;(21%-40%)=40%;(41%-60%)=60%;(61%-80%)=80% ;(81%-100%)=100%
为统计计算方便起见,采用估算选择范围的方法对权重值用5个百分参数确定: 20%、40%、60%、80%、100%。
二、实例
下面结合3个实例,对所作的权重及其方法进行说明:
实例1、高新技术中的电子计算机整机制造(指可进行算术运算或逻辑运算,包括中央处理机,并配有输入、输出装置和存储功能及其他外围设备的成套数字系统装置的制造,还包括来件组装电子计算机的加工活动。)
该领域所属的分类由18个IPC小类号或大组号组成(见对照表样页),现仅就其中的分类号大组 G06F3为例说明。
分类号 G06F3类名是“用于将所要处理的数据转变成为计算机能够处理的形式的输入装置;用于将数据从处理机传送到输出设备的输出装置”。它不仅包含了其中包含了计算机本身的输入或输出装置还包含了属于高新技术中的电子计算机外部设备制造(打印机、扫描仪、光笔等)和汉字编码等。
如何计算出仅属于该高新技术电子计算机整机制造领域的所属分类号的权重比呢?
1)首先,用课题分类法,在G06F3大组下,排除明显不属于该课题如打字机的或属于打印机等计算机外部设备的3/09、3/12、3/13小组分类;第二,使用CPRS系统检索G06F3大组,其结果有发明专利6433条记录,共128页。最后,在G06F3大组下17个小组分类号,除去不属于该课题的3/09、3/12、3/13小组分类共447项记录,得到与课题有关的共5996条记录共120页。
2)用三段浏览法,选其中的第1页、60页、120页浏览发明题目和文摘,分析结果如下:
浏览第1页分析:专利申请号由85100008- 85104390 共50篇专利,除去如汉字行素编码法、着重多种书写体的绘图终端等大约41篇有关汉字的编码或计算机外部用的设备外,其余都是与高新技术中的电子计算机整机制造本身有关的输入或输出装置共9篇。
浏览第61-62页分析:专利申请号00115933-00119999共50篇专利,除去如《中文声数编码》方
案及其实现方法、着重多种书写体的绘图终端、汉字行素编码法等共大约35篇有关汉字的编码或计算机外部用的设备外,其余都是与高新技术中的电子计算机整机制造本身有关的输入或输出装置共15篇。
浏览第117页分析:专利申请号200310111835-200310119878共50篇专利,除去如显示设备的触摸板、广州话拼音简码中文输入法等大约38篇专利,其余都是与高新技术中的电子计算机整机制造本身有关的输入或输出装置共12篇。
3)计算(请参看表1)

θ值是根据表1所算出的主分类号比例系数0.82加上修正值0.024
修正值=比例系数*副分类比例平均值*修正值系数

4)结果
按上述的关于权重值的划分和采用的估算选择范围的方法,确定其权重值=22,可估算为40。
所以,高新技术中的电子计算机整机制造(包括电子计算机、笔记本电脑、掌上型电脑、学习机、手持式信息终端机、个人数字助理剂(PDA)、电子快译通、电子记事本、电子词典等)的IPC分类号G06F3的权重值为40。
实例2、高新技术中的电子计算机外部设备制造
该领域所对应的IPC分类号之一是分类号大组 H04N1,该类名是“不随时间而变化的图像或图案的扫描、传输或重现”。其大组下有66个小组都涉及到有关计算机外设的扫描仪、打印机和传真机等,怎样计算其权重比呢?(参见表2)
用CPRS检索H04N1分类号下的发明共1797条36页。
浏览85101419-89106445之间的50篇专利的题目、文摘、权利要求,大约有10篇左右和计算机用扫描仪、打印机和传真机等外设有关。
浏览00121122-00806123之间的50篇专利的题目、文摘、权利要求,大约有25篇左右和计算机外设用扫描仪、打印机和传真机有关。
浏览200410005818-200410043487之间的50篇专利的题目、文摘、权利要求,大约有30篇左右和计算机外设用扫描仪、打印机和传真机有关。
公式:

高新技术中的电子计算机外部设备制造的IPC分类号H04N1的权重值为40。

实例3、
高新技术中的电子计算机整机制造的另一个分类号 G06F13类名是“信息或其它信号在存贮器、输入/输出设备或者中央处理机之间的互连或传送电数字数据处理的互连或传送”,根据高新技术的国民经济分类所定义的范围,用中国专利检索系统检索,其结果用三段浏览法查阅该分类号下的专利文摘和权力要求,其检索信息基本上都是有关中央处理机之间的互连或传送电数字数据处理的互连或传送,符合高新技术中关于“电子计算机整机制造”所定义的范围。因此,其权重值可认为100。
关于主题词算法,大家用的较多,这里不再详述,要注意的是,关键词的选择,要慎重,切忌太滥。有两点建议:
1)利用比较好的科技词库和其他工具词库扩充课题中的同义词、近义词可帮助查全;
2)利用分类号可帮助查准。
专利文献分类和国民经济产业(行业)分类是两个不同的分类体系,分类的原则是不同的,一个是以产业和产品划分,一个是以应用和功能划分,要找出其互相关联之处,需要不断的磨合、研究,需要在今后的工作中不断的改进和提高,同时也希望能得到各位读者的批评和帮助。



