醫學論文范文欄目提供最新醫學論文范文格式、醫學論文范文碩士論文范文。詳情咨詢QQ:869156324(發表);357500023(論文輔導)

非典冠狀病毒基因組中微衛星序列宿主特異性比較分析

日期:2020年02月27日 編輯:ad201107111759308692 作者:無憂論文網 點擊次數:896
論文價格:150元 論文編號:lw202002162226537753 論文字數:33655 所屬欄目:醫學論文范文
論文地區:中國 論文語種:中文 論文用途:碩士畢業論文 Master Thesis

本文是一篇醫學論文范文,本文利用公開數據庫中SARSr-CoV的165條基因組序列數據,根據其感染宿主的不同分為感染蝙蝠、果子貍、人類的三組SARSr-CoV,使用現有處理軟件以及多種編程語言靈活編寫所需腳本,,中微衛星進行數量統計,類型統計以及微衛星在不同區域上的分布特征以探究微衛星在SARSr-CoV基因組中的分布模式以及三組感染不同宿主的SARSr-CoV之間微衛星的差異。結果顯示,感染不同宿主的SARSr-CoV的基因組堿基序列相似度很高(>80%),且165條序列GC含量幾乎完全相同,但其微衛星的數量,類型以及在基因組上的分布模式都具有差異性。由此提示微衛星可以作為物種微進化分析中的有效手段.


第 1 章  緒論


1.1 生物信息學簡介

1.1.1 生物信息學的歷史變遷及其含義

生物信息學(Bioinformatics)第一次被提出是在 1970 年,在當時,生物信息學所包含的研究方向與現在完全不同,Paulien  Hogeweg 和 Ben  Hesper 創造這個詞時是用來代表研究生物系統中的信息(信號)過程的學科[1]。生物學以及生物信息學發展到今天,以計算機為主要研究工具對生命進行的數據計算分析成為了生命科學領域各方向中重要的組成部分。20 世紀 80 年代后,隨著對大量基因研究的深入,出現了基因組學,研究者們試圖對全基因組進行測序、分析和作圖,基因組學被認為是最具有意義,最有希望揭開生命奧秘的手段,以此為契機,到1990 年,以美國為首展開了 20 世紀最偉大的科研活動之一,人類基因組計劃被正式揭幕。且在不同物種中的測序工作也在馬不停蹄地進行中,世界上第一個細胞的基因組全序列在 1995 年被成功測序,一年后,酵母的全基因組也完全展現在人們的眼中。隨后,在 1998 年,人們對多細胞生物測序也宣布告捷,線蟲基因組也被展現。在一年后更復雜的模式生物,果蠅的基因組被宣告成功測序。到1999 年年底,對人類的基因組出現戰果,人體第 22 對染色在當年被測序成功。2000 年 6 月,人類基因組計劃已全面竣工,人類的遺傳物質已經毫無保留地完全展現在研究者的視線中。在此時期,對基因組大量測序的熱潮中,生物信息學相關研究人員,為了更好地存儲,檢索珍貴的測序數據,搭建了許多生物數據數據庫,例如著名的的 NCBI、SWISS-PROT 以及 EMB 數據庫均于此時期被建立。

此時還出現了一批經典的比較算法,1988 年,Pearson 和 Lipman 共同發明了 FASTA 快速比較算法比較算法。兩年后,1990 年,BLAST  (Basic  Local Alignment Search Tool)問世,現如今,FASTA 和 BLAST 的最新版本任然是是比較生物學每天都在使用的工具之一。 

時至今日,獲取數據已經不再是難題,測序時間和測序成本已經低到常人可以輕松負擔。每個人如果需要,都可以在一天內得到自己的全基因數據。海量的數據不斷地累計在數據庫中,但數據的海量不代表信息的海量,在如此龐大的數據面前,人們從中挖掘到的信息卻只是九牛一毛。由此生物信息方法顯得尤為重要,由前人測得的海量數據中,提煉出有用數據,精煉為一般知識和規律,是生物信息學的首要目標,為揭開生物體奧秘提供一個可能的道路。

...........................


1.2 常用生物信息數據庫

生物信息學研究最基本的基礎是各類生物數據庫,沒有各類生物數據庫大量生物數據的大量積累,生物信息學是無法進行研究的?;蚪M計劃的完成積累了超大量的生物信息。當今世界中,測序的速度與成本都已經發生翻天覆地的變化,
一個領著平均工資的普通人可以花上自己一個星期的工資在一天之內拿到自己的基因組全序列數據。全球的生物研究者都在進行大量的測序工作,越來越多的物種都已經被測序成功,巨量的數據每天都被添加,積累到數據庫中,面對這些堆積如山的數據,在研究者對其進行研究之前,首先需要的是找到在自己研究中將要使用到的數據。在這種研究需求的推動下,世界各地開始搭建生物信息數據庫,方便全球的研究者方便地搜索,管理和下載自己所需要的生物信息。此外生物信息數據的增加不只是核酸序列的增加,還包括蛋白質序列,蛋白質三維結構預測,相應的文獻數據的增加等等,這推動了專門的分類數據庫的快速發展,現今生物數據庫主要包括基因組數據庫、蛋白質數據庫、蛋白結構數據庫等。

1.2.1 不同研究方向代表性數據庫

截止 2013 年,Nucleic Acids Research 雜志統計了全世界 1512 個主要的分子生物學數據庫[8]。下面簡單列舉了一些不同研究方向具有代表性的數據庫(表1.1)。各種目的性,針對性不同的生物數據庫,可以為相關專業人員提供其專業相關的數據。大量分類準確的數據庫各司其職,不同研究方向的研究者都可在相關數據庫中找到自己所需的數據,數據庫的專業性更可以高效提高研究者管理維護數據的質量與效果。 

表1.1 不同研究方向代表性數據庫列舉

........................


第 2 章 SARSr-CoV 基因組中微衛星分析


2.1 前言

微衛星序列是基因組中廣泛存在的一種以 2-6 堿基為重復單元重復多次的簡單重復序列,數量豐富,分布廣泛,具有高度多態性[54]。大量研究表明,作為基因組一個重要的組分,微衛星在基因組中的非編碼區,編碼區,基因間區,都有大量分布,且影響著蛋白的功能、生物遺傳以及基因調控,是基因組研究領域的一個熱點[55-56]。微衛星序列在真核生物和原核生物基因組中普遍存在,并被廣泛研究[57],但目前還沒有 SARSr-CoV 基因組中微衛星序列相關報道。

2002 年到 2003 年,從亞洲開始,一直蔓延并爆發到全球的恐怖流行病,非典型性肺炎  (Severe  acute  respiratory  syndrome,  SARS)導致全世界范圍內 37個國家 8098 例感染,其中  774 例死亡[48] ,死亡率為 9.6%[49],到了 2004 年,SARS 便迅速銷聲匿跡,已經沒有任何有關 SARS 發病的報道[50]。

在同年 5 月,研究者從廣州的市場中售賣的動物體內也采集到了SARS 冠狀病毒的病毒樣本,但被感染的動物未出現臨床癥狀。此后,在 2005年,從中國蝙蝠體內采集到了數種與 SARS 冠狀病毒相似性極高的新型冠狀病毒,并取名為 SARS-like 冠狀病毒[58-59]。蝙蝠雖攜帶 SARS-like 冠狀病毒,但未表現出任何相關病癥,推測出蝙蝠為 SARS-like 冠狀病毒的天然宿主,系統發生分析顯示,蝙蝠攜帶的 SARS-like 即為最終導致非典的元兇,并以果子貍作為中間動物宿主最終傳播到人[60],導致疾病且在人群中傳播。

本研究以 SARSr-CoV 基因組為研究對象,利用生物信息學方法,對基因組中的微衛星序列進行綜合分析。試圖從微衛星的角度,給予 SARSr-CoV 跨宿主進化的原因一點參考與提示。

.........................


2.2 材料與方法

2.2.1 基因組序列數據

從 NCBI 的 Genbank 數據庫中查詢并盡可能多地下載具有完整序列注釋的165 條 SARSr-CoV 基因組全序列,并依據其感染宿主的不同分為三組,感染蝙蝠、人類以及果子貍的 SARSr-CoV 序列。因各 SARSr-CoV 基因組中 5’端與 3’端序列測序長度有著很大的差異性,為了在分析過程中將不同序列的基因區域對齊,所有 SARSr-CoV 基因組序列的 5’端與 3’端序列均被移除。簡便起見,使用 B1-B37、C1-C24 與 H1-H104 來表示感染不同宿主的 SARSr-CoV 基因組序列,其中 B1-B37 為感染蝙蝠的 37 條 SARSr-CoV 基因組序列;C1-C24 為感染果 子 貍 的 24 條 SARSr-CoV 基 因 組 序 列 ; H1-H104 為 感 染 人 類 的 104 條SARSr-CoV 基因組序列  (表 2.1)。  原始全基因組序列長度為 28735~30309  nt,最長序列為 B24,最短序列為 B27。去除 5’端和 3’端后用于本文的序列片段長度為 28155~29690 nt,最長序列為 B24,最短序列為 B34。 

表 2.1 165 條 SARSr-CoV 基因組序列基本信息

..........................


第 3 章 SARSr-CoV 中微衛星序列宿主差異性分布分析 ................................. 27

3.1 前言 ............................... 27

3.2 材料與方法 .............................27


第 3 章 SARSr-CoV 中微衛星序列宿主差異性分布分析


3.1 前言

在上一章中,比較分析了感染蝙蝠、果子貍以及人類的 SARSr-CoV,結果顯示三組病毒雖堿基組成高度相似(>80%),但其微衛星分布在整個基因組上無論是數量還是類型都存在差異。第二章的統計分析中發現了感染不同宿主SARSr-CoV 微衛星的差異,但只能得到基因組上微衛星的平均情況,實際上,微衛星在基因組的不同區域有著不同的突變率[16],且在基因組不同區域的微衛星擁有不同的功能[20],導致微衛星的分布是與基因組區域相關的,第二章的研究并沒有顯示出區域間微衛星分布的差異。在本章中,通過對基因組分割成許多小區域,并對各區域內

該論文為收費論文,請掃描二維碼添加客服人員購買全文。
毛茸茸BBWBBW