Friday, June 26, 2015

如何深入挖掘citation

许多板上介绍I-140 DIY经验的帖子都讲到要“深入挖掘citation”,但是很少系统性
介绍如何“深入挖掘”,所以自己在DIY做材料的时候苦于没有一个step-by-step的
guideline,于是我对citation analysis这个事儿做了些研究总结,分享出来benefit
后来人。

开篇点题,引用一句俗话“没有丑女人,只有懒女人”——在这里我要说“没有弱case
,只有不认真挖掘的case”。citation少,咱们可以借鉴一下女生照相——化浓妆、摆
pose、打光、PS,各种修饰一番后恐龙也能照成白富美。同理,按如下方法挖掘
highlight一番之后,再少的citation也能塑造成学术大牛:

1. 引用杂志:可以挖掘引用杂志的IF, Eigenfactor,及其排名(最好和所有SCI收录
的8000多本杂志比较),还有篇数,证明经常被发表在top journal的文章引用。可以
在exhibit里列一个总表,把所有的引用杂志按排名升序排列,这样很多数据便一目了
然了,如:一共被多少本杂志引用过,被top 50 (or 100) 杂志中的多少本引用过,超
过半数的引用杂志排名10%等。最后选择排名最靠前的几个杂志单列一个表格放进
petition letter里,并把对应的引用原文附在exhibit供IO查阅。

2. 引文类型:看引用的文章是conference proceedings, research articles, review
articles, book chapters。被book chapters或者review articles引用是证明影响力
的一项重要证据,可以把这些引用单独挑出来,在exhibit里(and/or petition 
letter里)列一个总表,再附上对应的引用文章原文。如果有review articles发表在
top journal或者有book chapters是权威教材的章节,还有被某业界大牛引用,还可以
专门提一下。

3. 出版社:Elsevier, Springer, Wiley, Taylor & Francis一般被称为academic 
publishers里(或者专业术语叫Scientific, Technical, and Medical (STM) 
publishers)的big four,如果有引用的杂志或书是它们旗下的,也可以拿出来说一。
Big four基本是“大而全”,其次一些“小而美”的杂志社NPG, ACS, APS, RSC等也是
响当当的,可以举证证明其top。

4. 作者:作者可以挖掘的信息很多,比如总共被多少independent authors引用过,这
些人里有多少是PI, Full (or Distinguished) Professor, Fellow of prestigious 
professional associations, 或者各国的院士,甚至是Nobel (or Wolf) laureates。
这里要不厌其烦地去search这些作者的background/CV,发现一些共同的闪光点,然后
把他们归类,比如:被N个院士引用过,petition letter里列个表格,再在exhibit里
附上NAS/NAE官方网站上的profile或学校网站上的profile;如果院士数量不多的可以
把各种fellow列一个表格。如果有的院士在多篇文章里引用过你的成果,那便可以考虑
邀请他们做你的推荐人了。

5. 单位:单位(affiliation)可以和国家一起挖掘,把作者的所属单位按国别排列,
列一个总表,这样总共被W个国家的X个研究机构的Y个研究人员的Z篇文章引用便一目了
然了。做过这个survey之后,可以见仁见智使用各种排名来说明引用的研究机构是top 
ranked。我推荐使用Nature Index的top 200 research institutions和top 100 
countries排名,一是因为各种流行的世界大学不包含国家实验室和独立研究机构,二
是因为大学排名的参考因数众多,而Nature Index更单纯地反映研究机构的学术地位。

6. 国家:做过如上的comprehensive survey之后文章被几个大洲的多少个国家引用过
的数据也就有了,而且按照Nature Index的国家排名,可以在petition letter里放个
柱状图来illustrate引用国家的distribution,然后说明一下,如:top 10的国家全部
引用过自己的文章。

7. 如何引用:如何被引用是个关键,是在introduction里做footnote呢,还是用在正
文里支持 key claims;是大段介绍呢,还是在一句话里略有提到;有没有一篇文章多
次引用你的同一篇paper或者多篇paper;有没有同一个group在好几篇文章里引用你的
同一篇paper或者多篇paper。结合前面的author和institution分析,也可以把多次引
用的cases列表或者柱状图。前面介绍的几项分析只是干瘪的数据,说明各种top,各种
分布广,而“如何引用”才是画龙点睛之笔,实实在在说明你的research怎样
influence其他的researchers。而如何影响别的researcher最好不要自己在petition 
letter里王婆卖瓜,而是把有代表性的引用整理出来,放在推荐信里,让推荐人用第三
方的权威话语来向IO解释一下你的工作在这些citation里的关键影响,然后在petition
letter里大段摘抄RL里的原文就行了。

上述几项analysis,有交叠的地方,比如scenario:美国某牛校的某院士在某主流出版
社旗下的某top journal写了一篇review paper来大段介绍你的work。对于这种情况,
有时一篇很好的引用可以同时放在几个证据堆里,但也要尽量有所取舍,避免重复举证。

我在exhibit里专门把citation analysis放了一个部分(约占总厚度1/3),分为如下5
个方面,然后把引用的段落在打印的原文中highlight出来:
1) Citations by top journals
2) Citations by review articles & book chapters
3) Citations by NAS/NAE members
4) Citations from “top 50 countries”
5) Citations from “top 200 institutions”

最后的话,citation在我看来是一个最最关键的证据,很多被RFE contribution的都是
被IO在citation或者impact上挑毛病,而从各个方面,各种角度系统性地做citation 
analysis则可有效避免这种RFE的发生。我建议整个绿卡材料准备从citation analysis
开始,按上述方法一气呵成,这个analysis做完,authorship和contribution两个
criteria的大部分work也就做完了,并且找哪些引用过你paper的人写推荐信也就心中
有数了。还可以把这个思路套用在对审稿的分析上,突出paper review部分的亮点。

No comments:

Post a Comment