PRODUCT CLASSIFICATION
產品分類大數據時代已經來臨。2014財年,美國政府就如何充分利用生物醫學大數據,啟動Big Data to Knowledge計劃,這是繼2012年美國國家大數據計劃實施后新一輪面向生物大數據的基礎研究計劃。目前,發達國家在生物大數據領域的技術和應用已遠遠走在前端。在我國,生物大數據還處于發展的初期階段。該如何以zui快的速度趕上這一潮流,如何從國家主權層面對生物大數據進行有效的保護和管理,如何在基礎研究和技術市場應用上與世界同步,已成為不可回避且值得深入思考的話題。
誰是生物大數據技術的者
大數據發展的核心動力來自于人類記錄、測量和分析世界的渴望。當前,高通量測序技術的快速發展,使生命科學研究獲得了強大的數據產生能力。
哈爾濱工業大學計算機科學與技術學院院長王亞東教授告訴科技日報記者,上世紀90年代,科學家花費10年時間、近30億美元獲得了*個人類基因組圖譜;而今天,完成一個個人基因組測序不到一天時間,費用低于1000美元。
自人類基因組計劃完成以來,以美國為代表,世界主要發達國家紛紛啟動了生命科學基礎研究計劃,如千人基因組計劃、DNA百科全書計劃、英國十萬人基因組計劃等。這些計劃生物數據呈爆炸式增長,目前每年產生的生物數據總量已達EB級,生命科學領域正在爆發一次數據革命,生命科學某種程度上已經成為大數據科學。
“這還只是剛剛開始",王亞東強調,“隨著測序技術在醫療、健康、醫藥、環境、能源等相關領域的廣泛應用,人類將面臨生物數據的海洋,其將成為這些領域創新的源泉,對這些數據創新性的管理和應用,將為生命科學及相關產業領域帶來一次新的革命。"
與蒸蒸日上的生物大數據創新發展熱潮相比,中國的研發及應用才拉開帷幕?!拔覀兣c前沿技術水平至少相差30年,差距主要表現在數據分析、數據管理和與研究的應用對接上",上海生物信息技術研究中心主任李亦學研究員對此深表擔憂。
李亦學分析認為,我國有四大方面非常欠缺:其一,國內現有的生物大數據分析能力雖然與歐美相差不大,但是在數據分析構架、軟件系統與*IT技術接軌上有待提升。其二,國外在生物大數據領域的人才多,盡管我們也有*刊物上發表的論文和成果,總體而言,國內高水準團隊還是少。其三,歐美講求成果應用,層出不窮的分析軟件可被實驗室、研究、產業多方應用。其四,在生物大數據理論研究、標準制定和廣泛應用上,中國都亟待全面跟進。
誰將生物大數據應用的市場和資源
對生物大數據的有效管理和利用,發達國家很早就開始了競爭。早在上世紀80—90年代,美國、歐洲和日本即已分別建立世界三大生物數據中心:美國國家生物技術信息中心(NCBI)、歐洲生物信息研究所(EBI)和日本DNA數據庫(DDBJ)。
王亞東強調,“這三大生物數據中心掌握并管理著*的生物數據和知識資源,并處于壟斷地位。"
美國國立衛生研究院(NIH)建立了8個*生物數據技術研究中心,旨在長期發展生物大數據分析技術,提高生物大數據利用和轉化能力,并保持其地位。王亞東進一步指出,美國政府于近兩年兩次啟動生物大數據研究計劃,目的是有針對性地研究生物大數據管理、分析、共享等生物領域迫切需要的核心技術,從根本上提升美國利用生物大數據的水平,并以此帶動生物領域研究與產業發展。
在商業領域,生物大數據的應用市場也如雨后春筍,目前,一些公司已開始提供生物大數據服務。例如,投資DNANexus公司,提供生物大數據管理和分析服務,并于2011年接管NCBI數據;早在2006年,23AndMe公司就開始提供個人基因組數據分析服務,目前其受益者總數已超過50萬人;英國衛生部于2013年專門建立了Gel公司,管理和分析英國十萬人基因組計劃產生的基因組數據。
BCC報告指出:“至2018年,生物大數據的市場總額將增長至76億美元,年復合增長率達到71.6%。"麥肯錫公司報告指出:“如果美國醫療保健行業有效利用大數據,就能把成本降低8%左右,從而每年創造出超過3000億美元的產值。"
誰來掌控我國生物大數據主權
對于一個國家而言,重要領域的大數據已成為戰略資源,擁有數據的規模和運用數據的能力將成為一個國家綜合國力的重要標志。
我國人口居世界*,生物樣本資源豐富,這將使我國很快成為生物數據產出大國,但目前還不是生物大數據利用強國。
事實上,上生物數據資源一直掌握在歐美的幾大數據中心。我國產生的許多生物數據資源不得不提交到這些數據中心,導致我國投入大量資金與人力產生的生物數據嚴重流失。
在生物大數據領域,我國缺乏從國家層面對生物大數據進行有效管理與利用的體制、機制和環境,李亦學稱,“這已經使中國的生物數字主權受到嚴重威脅"。
王亞東也強調,“現在上的三大生物數據中心都是歐美國家層面建立的,并免費向開放。我國的相關科學研究和市場應用發展受益于這些數據中心,同時也嚴重依賴和受制于此。"
業內人士指出,我國尚未建立面向生物大數據技術發展的*技術研究中心,技術研發缺乏宏觀規劃和引導,技術產出較少,難以建立完善的生物大數據技術體系,不能滿足生物大數據發展面臨的數據管理和服務需求。同時,除了哈爾濱工業大學和上海生物信息技術中心等少數高校和研究所建立了生物大數據專業研究團隊外,人才缺口較大。
大數據的使用已經成為一個國家各領域提高生物試劑力、創新能力以及競爭力的關鍵要素。
專家們指出,生物大數據是國家戰略資源,對生物大數據資源的管理和利用應上升為國家意志,并考慮實施如下措施:建立國家生物大數據中心,保障我國數字主權,統籌管理和合理利用國家生物大數據戰略資源;通過國家科技政策,集中突破生物大數據核心技術,形成自主關鍵技術與系統產品,打破美歐技術限制;以現有優勢學術和技術資源為基礎,建立*生物大數據研究機構,提升我國生物大數據技術和服務水平,并培養專業的生物大數據人才;強調應用需求牽引和政策支持,以加快生物大數據產業的全面發展。