臨床研究的結果,最終多以論文的形式發表在 醫學期刊上。雖然風濕病學的論文質量不斷提高,但運用循證醫學的評判(critical appraisal)提綱來閱讀,仍有較大的距離。
臨床醫學論文的結構如图1所示,其中摘要部分一般有固定的格式,即“目的、方法、結果、結論”,摘要部分只求簡單扼要,不要詳細的解析和分析。因此,下面重點討論後面四大部分。
1.引言
引言俗稱為“開場白”,對判斷文章的價值有重要的作用。它不但給讀者,也往往給審稿人和期刊編輯部一個“先入為主”的印象。臨床文獻評判提綱的第一條就問到[1]“作者研究的目的是什么?是否為解答某個(些)研究問題或驗證某個假說?如果是的話,你能否從文章中歸納出該研究的问題或假說?這個研究問題或假说是否關於某個幹預(如治療)的效果、因果關系或確定某个健康問題的強度?”引言中最重要的內容就是要清楚地將研究的目的告訴读者,同時要交代研究的背景和立題的依據。一般要求先從總體上介紹研究背景,逐漸縮小到立題依據,再集中到研究目的。所以如圖1所示,引言部分呈倒梯形結構。
國际上有一些醫學期刊,要求在引言部分詳細地介紹研究背景和立題依據,但更多的國際和國內醫学期刊,是要求在引言部分简明扼要地介紹研究背景和立題依據,然後集中到研究目的。這樣一些研究背景和立題依據的内容,就需要在討論中描述。一個好的引言應該是用幾句話概括先前這個領域的研究,接著說明這個研究的必要性,必須如實地闡述你的研究比先前的研究好在哪裏,新在哪裏。
2.材料與方法
2.1文章科學性和有效性的體現許多基層醫院的醫生和沒有循證醫学概念的醫生,在閱讀論文時,常常不太註意其研究方法。然而這一部分的內容往往体現出文章的科學性和有效性,因此它是期刊確定論文的取舍最關鍵所在。臨床文獻評判的9條提綱中,有7條是反映在“材料與方法”部分。
由於國內風濕科醫生中接受過流行病知識培訓者甚少,加上許多人在平時閱读文獻時,常跳過“材料與方法”部分,致使風濕病學的論文普遍存在這樣的问題:如果論文涉及到有實驗室內容者,則將大部分的篇幅放在描述實驗室的方法,而忽略了體現文章的科學性和有效性的內容;如果论文不涉及到有實驗室的内容,則不知道這部分該寫什麽,不少臨床論文在“材料與方法”部分中,只用幾行字,因為“沒東西好寫”。其實一篇論文質量高低,往往體現在這一部分。因此,要提高風濕病学論文的質量,需要從這裏入手。
建議有誌於提高自身論文寫作能力的年輕風濕科醫生,從Lancet、New Engl J
Med、BMJ、JAMA等高級期刊中,尋找10~20篇自己感興趣领域的論著,詳細閱讀(重点放在“材料與方法”部分),並選其中3~5篇,按評判提綱進行評判性的閱讀。完成以後,對你的臨床研究和論文書寫必將會有長足的進步。筆者在國際臨床流行病學工作網,澳大利亞的培訓中心學習期間,各 國學員普遍都感覺到,在上了“critical appraisal”的課和做完“critical appraisal Exercise”的作業後,有“茅塞頓開”的感覺。
2.2需要闡明的內容不少論文將病例的性別、平均年齡、平均病程、基线的比較等“結果”部分的內容提前寫在“材料與方法”中,这是不恰當的。“材料與方法”主要是描述該研究的計劃,主要包括6個方面。
2.2.1研究策略: 論文需要闡明研究策略[2],可以直接,也可以間接,但必須讓讀者很明確地知道本研究的策略。因為讀者需要判斷,該研究策略用於解答本項研究的問題是否恰當。風濕病學的論文中,實验性研究(隨機 臨床試驗
)和分析性研究(隊列研究與病例對照研究)較少,多數论文是描述性,或者根本無法從論文中悟出其研究策略。因此,強調在寫文章時,需要留意一下研究策略交代清楚了没有。因為沒有研究策略的論文,資料再好,也只能是一盤散沙。
2.2.2研究樣本:
臨床研究的樣本主要是病人,樣本来源必須被闡明。研究病例最好是某一時段內的連續性的病人,如果不是連續性的病人,有必要闡明如何從大組的病人中選取研究樣本。風濕病學的论文中,不少在介紹研究對象時只簡單地提到“××病××例,均符合××診斷標準”,至於研究樣本來自何方,是哪個年代的病人,如何抽樣等等,一概不說。這樣的論文,讀者根本就無法判斷該研究的外部有效性,難以被循證醫學接受。研究樣本的入選標準和排除標準也必须詳細描述。在病例對照研究中,對照組的構成和來源必須交代清楚,因為對照組的確定問題,容易造成偏倚。
2.2.3研究因素:
在實验性研究和分析性研究中,研究因素非常重要,往往是該項研究的核心內容。因此一定要明確交代研究因素以及测量這些研究因素的方法。在實驗性研究,分組是否真正隨機,如果不是隨機,必須比较兩組間的基線是否基本相同;幹預組和非幹預組的治療方法有何區別,除干預之外,其他治療是否相同,幹預组和非幹預組各自的治療方法必須交代清楚。分析性研究中,研究因素存在與否,是病人進入研究時已經存在,而不是按照研究者的意願进行分組的。因此,需要交代的是其测量方法,而不是分組。在審稿時,見過一些論文錯误地將類風濕關節炎的病人“隨機地分類風濕因子陽性组和陰性組”。在隊列研究,研究因素的確定在先,結局的判斷在後,一般較少發生研究因素測量時的主觀偏倚;但在病例對照研究,由於先确定病例組和對照組,在回顧暴露因素時容易出现主觀偏倚,文章在這裏必須交代避免偏倚的方法,如采用盲法等。
2.2.4研究結局:
研究結局的判断必須準確無誤,因此需要交代判斷研究結局的方法。如果結局的判斷受研究者主觀因素的影響,如關節炎的放射學損害,則必須交代是否采用盲法。在隨訪研究(包括隨机臨床試驗和隊列研究)中,失訪病例如何歸屬,及其随訪時間如何確定,均需交代清楚。對於不以死亡為結局的研究,如何處理死亡者的資料,算刪失還是終點,時間如何確定等等。
2.2.5控制混雜和偏倚的措施:如果研究因素和研究結局之间有可能存在混雜因素,必須有措施去校正混雜因素所導致的偏倚。對於多因素的因果關系推導,必須采用多元回归的方法校正各因素之間的相互混雜。見過一篇強直性脊柱炎髖關節損害的相關因素的分析,立題和所收集的资料都很好,可惜只简單地采用t檢驗和χ2檢驗進行单因素分析,沒有校正各因素之間的相互混雜,如果作者在論文書寫時,有“混雜”這樣一個概念,自己或請 統計學
的老師,再花幾十分鐘的時间,進行多因素分析,論文的质量和可循證性將會有大幅度的提高,僅一念之差而使論文質量未能進一步提高,多麽可惜。減少或避免偏倚的措施需要交代,如在時間較長的随訪研究中,如何減少失訪。盲法不單只應用於實驗性研究,在分析性研究中,研究因素和研究結局的確定和判斷,也常常需要采用盲法。可導致偏倚的種類很多,本刊2000年有一講座《如何識別和控制臨床研究中的混雜與偏倚》已經詳細介绍。
2.2.6統計學方法:實驗性和分析性的醫学論文,均必須明確地交代統計學方法。多年來,风濕病學論文中統計學方法存在的問題較為突出。
有不少論文沒有交代統計学方法,多是那些含有實驗室研究内容的文章,由於花了大量的篇幅介紹實驗室的流程,使“材料與方法”部分顯得“充實”,因此遺漏或省略了统計學方法的描述,使文章不完整和欠缺科學性。有些文章在“統計學方法”一栏中,只用了5個字:“采用t檢驗”。也有些只寫“全部數据均由SSPS8.0軟件進行统計學處理”。沒有交代具體的統計学方法。讓人感覺到,這是在應付式的填補“缺项”,寫了等於沒寫
雖然t檢驗和χ2檢驗是基本的統計學方法,但並非“放之四海而皆準”。風湿病論文中,常由於盲目運用t檢驗和χ2檢驗,導致質量不高。首先並非所有资料的統計分析均可以用t檢验和χ2檢驗,病例數少和非正態分布的資料就必須用非參數檢驗方法,如秩和檢验和精確概率法等。多組間的比較可能需要采用方差分析;隨訪資料(如隨機臨床試驗、隊列研究等)用生存分析方法可能更佳;存在多因素的因果關系分析(如预後因素分析、病因學研究等)需要多元回歸分析等等。不少論文在交代統計學方法時,籠統地說采用多元回歸的方法,究竟是哪一種回归方法沒有說明,從“結果”中也看不出其資料是否采用了回歸方法。濫用相關分析和直线回歸的現象也很普遍。实際上,相關分析是一種低層次的统計學分析方法,主要用在描述性研究(如橫斷面研究)的資料分析,而一般不用於實驗性和分析性研究的資料分析。因為相關分析有統計學意義並非代表两組資料存在相關關系。由于在回歸分析的統計學教學中,一般是從直線回歸到Logistic回歸,再到cox回歸,因此回歸分析的原理和精神,多在直線回歸中進行交代,使學習統計學的 醫學研究生們普遍對直線回歸的印象較深。其實直線回歸分析很少被運用於醫學研究,醫學研究中運用的最廣的回歸分析是Logistic回歸和COX回歸。
另外,風濕病學论文中,極少提到樣本量的推算。樣本量的推算主要是使研究的結果避免犯統計学第Ⅱ類錯誤。第Ⅱ類错誤是指由於樣本量不足,使得本來有差異的兩組,運算出无差異的結果。樣本量的推算是根據研究者期望的差異值、檢出意義的水平(α值)和研究的功效(1-β值)。β值是允許犯第Ⅱ類錯誤的概率。一般要求α值=0.05,研究功效在0.8或0.9。當你的研究結果中存在P值>0.05時,則要求文章有樣本量的推算,或提供研究功效。
3.結果
寫论文最主要的目的就是向讀者展示研究的結果,论文的核心和精髓主要體現在“結果”部分。因為在“引言”部分,你所提出的问題,均可在“結果”部分找到答案。這部分要求對研究結果進行客觀的陳述,既不受其他文獻的影響,也不受作者主觀意願的左右。所以图1所示,“結果”部分是一個方形的結構,提示它不需要拓展,只是要客觀的陳述。
一份好的“結果”,必須讓讀者順著你的思維,一步一步地獲得答案。通過文字告訴讀者本研究发現了什麽;通過表格將具體的數據有條理地展現給讀者;通過圖形使讀者能夠直觀地理解研究的结果。
3.1研究資料基線的描述雖然有些作者將研究資料基線的描述放在“材料與方法”中,但實際上基線的描述放在“結果”中更加确切。因為“材料與方法”主要是交代研究的計劃,至于所收集的病例中年齡多大、男性占多少、病程多长等等,是在結束研究後資料分析時才知道。如果是分組的研究,需要比較各組間的基線是否相同。隨訪研究還要比較失訪者或中途淘汰病例的基線是否有別于組內待分析病例的資料,讓讀者知道失訪或中途淘汰病例是否導致研究的偏倚。
3.2統計學運算結果實验性和分析性研究的結果很大部分是来自統計學運算的結果。这裏結合這幾年風濕病學論文的“结果”部分常見的一些错誤(不一定在本刊)進行討論,以減少今後的論文繼續出現類似問題。
3.2.1P值問題:盡管中華医學會雜誌社一直強調“應尽可能給出具體的P值”,但是风濕病學的論文中用“<”或“>”來表示者仍占絕大多數。曾對來審稿件和一些已發表論文,根据文章中所提供的資料(如病例數、均數、標準差等)進行復算,發現不少錯誤或欠缺。例如有些P值在0.05~0.1之間,卻被寫成<0.05;一個表中,多個組合的比較,作者用“
為P值<0.05, 為P值<0.01”, 為P值<0.001”,復算的結果是“ ”的數值中有些P值是落在0.01~0.001之間或0.001以下。既然文章中已闡明統計學運算是采用统計軟件,計算機
運算的結果就肯定是具體的P值,因此論文沒有理由不給具體的P值。只有當P值非常小,計算機運算結果顯示的P值為0.000”时,論文中才標“P值<0.001”。
3.2.2註意相關强度及其95%可信區间的表示:臨床研究的結果常常涉及到相關強度的運算,最常用的是OR值和RR值。有些已發表的論文,作者明明在統計學方法中说用Logistic同歸或COX回歸,但結果中卻找不到OR值或RR值。相關強度及其95%可信區間的運算和意義己在前面几講中討論,這裏不重复。值得一提的是,不少文章中OR值或RR值的95%可信區間包含了1,P值卻<0.05,計算機肯定不會运算出這樣的結果。
3.2.3數據必須与研究資料一致:少數論文的結果中,數據與研究資料相差太大。例如一篇長期隨訪的研究,在“材料與方法”中註明“為1985年1月至2000年12月”,而“結果”中的3個生存曲線圖,均顯示曲線右端到達25年,究竟是哪個环節出問題呢?
3.2.4避免違反科学的數據:不時見到一些違反科學的數據,使論文成為“垃圾”。例如一篇狼瘡性腎炎長期隨訪的論文,將1組病人的兩個結局(人生存率和腎臟生存率)的2條生存曲線描繪在一個坐標上,運用log rank檢驗,竟能“計算”出其χ2值和P值。計算機是不可能作這種運算的,因為這兩條曲線不可能作差異性檢驗。
3.3全面描述本研究的問題凡是可以进行統計學處理的資料,都應盡量運用統計學處理。但有些資料則需要進行詳細的陳述。應該說,該研究資料所能反映的各種結局都應該被陳述。例如,淘汰或失訪病例的數量和主要原因;各種療效和各種副作用;研究中出現的各種問題,包括意外的發現等等。有些意外事件的發生雖然不一定与本研究有直接聯系,但也必须如實描述,然後在“討論”中進行分析,陳述自己對這意外事件的觀点。陳述必須客觀,不要牵強,也不要討論和主觀推斷。討論和推斷必須放到“討论”中去。
4.討論
圖1所示,討論部分呈梯形結構,提示這一部分需要根據研究的結果,結合文献的回顧,拓展開來分析討論,以得出本研究的結論。
如果引言部分限於篇幅,無法詳细介紹本項研究的背景和立論依據,則可以在討論的第一段补充描述。需要註意的是,論文中不要輕易出現“首創”、“領先”或“過去未見報道”的字眼。如果確是如此,應該客观地陳述:用哪些詞(如甲氨蝶呤和成人Still病)檢索哪個數據庫(如Medline或PubMed),检索的結果如何。因為從這些數據庫中找不到的文獻,不等於全世界就沒有人報道過。客觀地陳述檢索結果,容易被人家接受,而且讀者必要時也可以運用同樣的策略,重復進行检索。
討論中必須緊緊圍繞著自己的研究結果,分析國際上其他學者同類的研究,哪些是相同的,哪些是不同的,或者相反的,並分析不同的和相反的的原因。如果你的資料是真實的,研究設計是科學的和合理的,就應該敢於相信,並堅持自己的觀點。科學的東西,總是會存在不同的觀點。当然,文章中有必要分析其原因,如種族的差異、研究樣本中亚型的不同等等。討論中需要避免離開自己的研究結果,討論得太遠,導致離題。臨床文獻評判提綱的最後一條就問到[1],“研究結论的引述是否根據研究分析的結果?針對研究的問題,作者作出了什麽結論?根據本研究,作者是否又提出了新的假說?”一篇臨床醫學論文,往往就是圍繞著這些問題劃上句號的。