作者:王啟蒙 專(zhuān)利分析師
在專(zhuān)利檢索中,有兩個(gè)重要的指標(biāo),查準(zhǔn)率和查全率,這兩個(gè)指標(biāo)直接關(guān)系著后期專(zhuān)利分析以及報(bào)告撰寫(xiě)的質(zhì)量,是后期分析的基礎(chǔ)。
查準(zhǔn)率是指專(zhuān)利檢索的結(jié)果中,檢索出的相關(guān)專(zhuān)利量與檢索出的專(zhuān)利總量的比值,用于衡量專(zhuān)利檢索的準(zhǔn)確度。
查全率是指專(zhuān)利檢索的結(jié)果中,檢索出的相關(guān)專(zhuān)利量與專(zhuān)利庫(kù)中所有的相關(guān)專(zhuān)利量的比值,用于衡量專(zhuān)利檢索的全面性。
假設(shè)檢索出的相關(guān)專(zhuān)利量為A,不相關(guān)專(zhuān)利量為B,未檢索到的相關(guān)專(zhuān)利量為C。那么,查準(zhǔn)率Z=A/(A+B)*100%,查全率Q=A/(A+C)*100%。
在一定程度上,查準(zhǔn)率和查全率是一對(duì)矛盾體,難以雙全,要想確保較高的查準(zhǔn)率,就會(huì)犧牲一定的查全率,反之亦然。想在專(zhuān)利檢索過(guò)程中同時(shí)保證查準(zhǔn)率和查全率,幾乎是不可能的,同時(shí),也是沒(méi)有必要的。不同的檢索報(bào)告,對(duì)于查全和查準(zhǔn)的需求是不同的,比如,對(duì)于查新檢索和專(zhuān)利無(wú)效分析檢索,對(duì)查準(zhǔn)率的要求更高,盡可能降低專(zhuān)利量的總數(shù),將閱讀專(zhuān)利的精力集中在相關(guān)性高的專(zhuān)利上;而對(duì)于防侵權(quán)檢索和產(chǎn)業(yè)分析,對(duì)查全率的要求更高,需要盡可能命中所有的相關(guān)專(zhuān)利,尤其是對(duì)于防侵權(quán)檢索,如果漏掉了侵權(quán)風(fēng)險(xiǎn)高的專(zhuān)利,那后果將是致命的。
對(duì)于查準(zhǔn)率的評(píng)估,是比較容易進(jìn)行的,可以通過(guò)抽樣的方法,比如,在檢索結(jié)果總數(shù)中,隨機(jī)抽取100篇進(jìn)行閱讀,若相關(guān)專(zhuān)利數(shù)為60,那么該檢索式的查準(zhǔn)率即為60%。
但對(duì)于查全率的評(píng)估,無(wú)法像查準(zhǔn)率的評(píng)估那樣直接進(jìn)行,原因在于,查準(zhǔn)率的評(píng)估中,檢索出的相關(guān)專(zhuān)利量A、不相關(guān)專(zhuān)利量B,都是已知的,而查全率的評(píng)估中,未檢索到的相關(guān)專(zhuān)利量C,由于并未檢索到,是不可知的,因此,專(zhuān)利庫(kù)中的所有相關(guān)專(zhuān)利總量A+C,是無(wú)法獲知的。
因此,需要借助其他的手段間接地進(jìn)行查全率的評(píng)估,關(guān)鍵在于構(gòu)建一個(gè)合適的、可操作的查全樣本。
構(gòu)建重要專(zhuān)利集
目前最常被用到的評(píng)估查全率的方法是,基于重要專(zhuān)利集構(gòu)建查全樣本。該重要專(zhuān)利集可以是重要申請(qǐng)人、重要發(fā)明人,或者某一年代的專(zhuān)利量。以重要申請(qǐng)人為例,首先,對(duì)檢索的結(jié)果中,以申請(qǐng)人為檢索入口,找出檢索結(jié)果中該申請(qǐng)人的專(zhuān)利量,并閱讀,得到檢索結(jié)果中該申請(qǐng)人的相關(guān)專(zhuān)利量a;其次,在專(zhuān)利庫(kù)中,以該申請(qǐng)人為檢索入口,找出該申請(qǐng)人的總專(zhuān)利,通過(guò)人工閱讀或者恰當(dāng)?shù)暮Y選,得出專(zhuān)利庫(kù)中該申請(qǐng)人的相關(guān)專(zhuān)利量b。由此可以得到,該檢索式的查全率為a/b*100%。借助重要發(fā)明人、申請(qǐng)年代進(jìn)行查全評(píng)估的方法與此類(lèi)似。
針對(duì)該方法,存在以下問(wèn)題,有些情況下,難以構(gòu)建重要專(zhuān)利集,比如,個(gè)別重要申請(qǐng)人的專(zhuān)利特點(diǎn)與整體專(zhuān)利有較大出入,國(guó)內(nèi)外不同申請(qǐng)人對(duì)某些專(zhuān)業(yè)用詞習(xí)慣不同等,又或者,行業(yè)內(nèi)相關(guān)重要申請(qǐng)人數(shù)據(jù)量過(guò)多,需要大量的閱讀,或者普遍數(shù)據(jù)量太少,不能構(gòu)成樣本。即便是選取了多個(gè)不同國(guó)家的重要申請(qǐng)人的專(zhuān)利作為樣本,仍然難以反映整體專(zhuān)利的特點(diǎn)。如此構(gòu)建重要專(zhuān)利集,容易出現(xiàn)以偏概全的情況。
下面介紹另外一種評(píng)估查全率的方法,可以避免出現(xiàn)這種以偏概全的情況。
構(gòu)建查全率極高的“理想”專(zhuān)利集
查全率難以評(píng)估的難點(diǎn)在于,無(wú)法獲取專(zhuān)利庫(kù)中的所有相關(guān)專(zhuān)利。然而,在犧牲了查準(zhǔn)率的情況下,通過(guò)一些全面的檢索手段,采用較為恰當(dāng)?shù)姆诸?lèi)號(hào)或者關(guān)鍵詞,是可以得到一個(gè)查全率極高的專(zhuān)利集的。以碲化鎘太陽(yáng)能電池為例,以碲化鎘和其英文表達(dá)方式cadmium telluride為關(guān)鍵詞進(jìn)行檢索,幾乎能囊括所有的碲化鎘太陽(yáng)能電池了,但得到的檢索結(jié)果中,還包括很多噪聲,原因在于,碲化鎘除了用于太陽(yáng)能電池,還用于光譜分析、紅外探測(cè)器和磷光體等。假設(shè)該檢索式得到的專(zhuān)利總量為a,對(duì)檢索結(jié)果隨機(jī)抽樣b篇,得到b篇中涉及碲化鎘太陽(yáng)能電池的專(zhuān)利有c篇,那么,可以依次估算出檢索結(jié)果中碲化鎘太陽(yáng)能電池相關(guān)的專(zhuān)利總量d=a*c/b。由于該檢索結(jié)果中幾乎囊括了所有的碲化鎘太陽(yáng)能電池,可以認(rèn)定d即專(zhuān)利庫(kù)中的碲化鎘太陽(yáng)能電池相關(guān)的專(zhuān)利總量。這樣,就構(gòu)建了一個(gè)囊括所有相關(guān)專(zhuān)利的查全樣本。由于該檢索過(guò)程中,查準(zhǔn)率通常會(huì)比較低的,難以用于專(zhuān)利分析,因此,需要進(jìn)一步修改檢索式,提升查準(zhǔn)率,才能得到一個(gè)便于進(jìn)行分析的專(zhuān)利集。以碲化鎘為例,將碲化鎘相關(guān)的關(guān)鍵詞和太陽(yáng)能電池相關(guān)的關(guān)鍵詞做“and”運(yùn)算,能獲得查全率和查準(zhǔn)率均相對(duì)較高的結(jié)果數(shù),假設(shè)檢索結(jié)果數(shù)為e,對(duì)檢索結(jié)果隨機(jī)抽樣,評(píng)估得到查準(zhǔn)率f,那么此次檢索中命中的碲化鎘太陽(yáng)能電池相關(guān)的專(zhuān)利總量g=e*f。因此,可以得到查全率為g/d*100%。
這種方法,可以避免在構(gòu)建重要專(zhuān)利集時(shí)出現(xiàn)的以偏概全的情況,能夠較全面地評(píng)估查全率。但這種方法的使用限制較多,主要在于,有些領(lǐng)域,難以通過(guò)恰當(dāng)?shù)姆诸?lèi)號(hào)或者關(guān)鍵詞,獲得一個(gè)查全率極高的專(zhuān)利集,又或者,構(gòu)建出的該專(zhuān)利集查準(zhǔn)率太低,這樣的話,隨機(jī)抽樣的樣本專(zhuān)利數(shù)量過(guò)多,會(huì)造成大量的閱讀,致使對(duì)查全率的評(píng)估失去了意義。
第一種方法為主,第二種方法使用條件苛刻
綜上所述,本文中,介紹了兩種評(píng)估查全率的方法,一種是通過(guò)重要申請(qǐng)人等手段構(gòu)建重要專(zhuān)利集,另一種是,采用恰當(dāng)?shù)姆诸?lèi)號(hào)或關(guān)鍵詞盡可能獲得一個(gè)查全率極高的專(zhuān)利集。
第一種方法使用更普遍,第二種方法使用較少,僅適合那些可以構(gòu)建出極高查全率,但又保證一定的查準(zhǔn)率的領(lǐng)域。通常來(lái)說(shuō),第一種方法能夠適用大多數(shù)領(lǐng)域的專(zhuān)利檢索。但對(duì)于某些領(lǐng)域,難以選取合適的重要申請(qǐng)人,或合適的重要申請(qǐng)年代,此時(shí),可以嘗試第二種方法,能夠防止對(duì)查全率的評(píng)估出現(xiàn)以偏概全的情況,評(píng)估出較為準(zhǔn)確的查全率。