鉅亨網新聞中心
主持人:各位群友,各位嘉賓,今天非常高興大家來到了機械工業出版社,跟我們一起共享這個可以是令人感動的時刻,靜·拉攏一周年,暨《機器人革命》新書的發布會。
今天特別榮幸的邀請到華大基因CEO汪建先生,下面有請汪建先生致詞。
汪建:11點鐘的時候跟我要來講點東西,策劃一個想法,本來名字叫做智慧人生,改成了詞彙的匯,最近在商量智慧城市,我城市這個東西是乾巴巴的,圍繞社會發展,工業革命對財富的追求變成了主流了,那玩意兒生不帶來,死不帶去,大家把生命的重要性往往都遺忘了,特別是最近幾年來,我們國家的腫瘤發病率直線上升,心腦血管的死亡率直線上升,加上環境等各種各樣的問題。
人生一個很重要的問題就是對生命負責,對自己負責,在工業的大潮中,人工智能的開放發展中,把一些人生根本的東西都忘記了,我就跟楊靜能否來參與一下,聽一聽,結果主持人讓我先講幾分鐘,這是我兩個月前在科技部科技大會上給科技部的領導同志的彙報內容,我就簡單的講一下。
首先講一下生命大數據的重要性,現在人類已知的疾病,大概有1萬種,各國家批准的臨床診斷標準,有標準的診斷的方法,全球批准了大概3000種,中國批准的上市的藥物是2600種,美國人批准的藥物是4600種,粗粗的算了一下中國是3000種,中國有3萬-4萬家醫院,近1千萬的醫務人員,這幾個數字列在一起,3000種,3-4萬,1千萬,最后的結論就是三個字,就是不靠譜,到醫院去不靠譜。
我們為了工業發展,認為財死天經地義,我們的生老病死就是聽天由命了,特別是中關村這一代,沒有人把生命科學研究,把生命放在最重要的位置,這幾個數字一,如果不把自己當回事,到醫院去,就這一組大數據就蒙了,不可能解決問題。現在我們所有的疾病都是倒走的,生病了到醫院去,給你談談,估計一下,你是感冒了,咳嗽了,拉肚子,分科,分系統,做個X光,抽血檢測就給藥了,對不對你自己看辦吧。現在重大的疾病,所有的出生缺陷是不是就是一個基因病呢?所有的腫瘤是不是就是一個基因病呢?今天我們的醫院沒有手段對這方面進行檢測,也沒有手段鬧明白,為什麼弄不明白,我講了很多次了,一個人有10的14次方的細胞,每個細胞攜帶的基因數,ITCD的數目是6乘10的9次方,15年前為了破譯這個10乘6的9次方,美國政府牽頭38億美元,6個國家參與,我們有幸代表中國,那個時候我還在中國科學院,也參與這個計劃。做了38億美元,做一個人的基因組,花了13年的時間。所以我們的醫學科技,中關村沒有一個人敢碰這個領域。當時我們比較猛就干了個事,做了1%,到了10年以后,我們再做一個人類基因種,就花了幾百萬,到今年這個時候,對外的市場價格,用一個大家好記的數字就是3800美金。我在科技部表態,爭取在明年做到3800人民幣,從380億美元做到今天,看得見,摸得的3800塊錢的話,這種變化數目是三到五倍的摩爾定律的發展速度,我們叫是一個變種,華大基因有幸最早,一做這個項目和曙光合作,后來和總參的天河,后來又跟神舟,我們現在在天河一號用到一半,天合二號是30%-40%。我個人的健康數據是14T,我們過去每年是10-30P的速度出,過去明年會10倍的速度增長。可能要不了一兩年,按照國家的要求,2017年我們自己出的原始數據是1個EB,就是10的18次方,今天的天河二號承載不了,今天的存儲也承載不了,財政的壓力非常大。這樣的數據靠醫學界和生物界是沒有辦法承載的。現在大家都往三甲醫院跑,都去協和,他也沒有辦法回答,心腦血管病很多是最后發病的時候才發現,腫瘤也是這樣的,沒有大數據,沒有人工智能,是不可能解決這些問題的,所以今天有機會到這裏來跟大家交流一下,第一年是10的9次方,10的14次方,我們是20種胺基酸,排列組合是10的19次方,小分子,各種元素周期表100多元素,在我們身上有85種,跟蛋白質,其他分子的排列組合和作用是多少,不知道。我們的細胞是10的14次方,綠色的是摩爾定律,華大存儲和計算能力的實際增長,這不是模擬的,是把過去的10年實際的增長了一條。幾倍的摩爾定律,但是很遺憾的是除了剛才碰到的楊強,在跟我合作,在座的諸位都沒有跟我們合作,當年我們在北京的時候還和計算所李老師有一些合作,我們離開了以后和計算所的合作也基本上斷了。今天來這裏就是親大家注意這塊,這些數字,是生命真正的大數據,過去醫學只有集中在這塊,所以中華人民共和國醫學大數據做得最好的就是北大的一家醫院,是惟一的一個中國人拿到美國臨床醫學數字化認證的,25年的數據是60T,如果加上這些東西,我一個人就是4個T的話,會是什麼樣子,這是不可思議的事情。
華大基因經常做一些稀奇古怪的事情,去年12月份做了鳥類的研究,《Science》專刊發了28篇論文,華大是民營機構,基礎科研是是我們吃飽了撐的,顯示我們的虛榮心,顯示我們比別人厲害,用這種方式把鳥類的遷徙,達爾文以后用數字化的方式表示鳥類變遷。我們以前在北京鳥巢那裏后來搬到深圳大飛山,我們就是鳥人做點鳥事就算了,這是典型的生命進化的大數據。
這個是育種的,我們是把所有的相關物種全部撤了,和楊強他們合作的項目,他又有很多的進展,上次的預測是92.8,是不是又有進步了,換句話之,可能用不了兩三年,我的實驗室裏面就能預測出我們培育出什麼樣的種子,很高興的報告楊強,大家都以為我們是做一個人工智能的育種的模擬試驗而已,但是今年我們種地已經種了35萬畝了,這個業他們現在估計五到十年之內就可以做到萬億,就這一個項目。這是河南大旱,玉米地顆粒無收,小米平均量1100斤,平均收入6800塊錢。
小米加步槍,江山社稷,糧草先行,因為中國的品種沒有人育種,中國就被打敗了,我們要讓小米重返主戰場,今年是35萬畝,明年就是3500萬畝,后年就是3000萬畝,一畝地6000塊錢,除以2是3000,再除2是1500,就是幾百億的值了。我們不在你們這個行當,一次一次又一次的往我們這裏跑,一待就是五六個小時,希望我們跟他全面的合作,我們的目標非常簡單,中國出生缺陷,能不能拿下去,棄嬰導致的情況是不能再發生了,這個數據我們是能夠做到的,這些孩子,一針致聾都可以解決的,100萬人,大數據分析,國際上全球形成一個聯盟,我們來牽頭,提供最便宜的,相當於創客的模式,核心技術,把數據拿出來,估計幾年內就是幾百個P的數據,怎麼分析,希望大家幫忙,我到處區域,腫瘤也是一樣的,我們先把基因拿出來看一下肺癌,早期的時候這是癌症病人的腫瘤標注物,正常人的有一點點信號,我們現在比早期X光診斷提高好幾個月。腫瘤是可以早期預防的,這是(王軍林)的重要貢獻,今天上午他在峰會上講BT和IT的融合,整個深圳非常的轟動,從來沒有見過這樣大規模的談這個。講人類基因的時候遇到一個很重要的問題,腸道微生物對我們起到很強大的作用,這是同卵雙生,基因是一樣的為什麼差這麼多,這一篇文章當時評為影響世界的二十一世紀前十個熱點,當年他是24歲,評為影響世界的十大人物。因為糞便裏面有幾千種細菌,幾百萬個基因,分不開的,是一個數據模型,我們用幾萬個CPU算了好幾個月,基本上分辨出來了,組裝起來了,那是一個劃時代的影響,是一個典型的大數據。我個人,我過去的血是這樣的,白色的,紅細胞這樣,血壓是這樣的,我十幾年前在北京診斷為冠心病,現在怎麼樣了,就把腸道微生物一調,高血壓就沒有了,血糖降下去了,冠心病沒有了,冠心病好了,我自己把我早年的科學論文找出來了,我動脈硬化是可以消退的,但是怎麼樣形成更加智能化的系統,我告訴大家不知道,我們得做100萬人,一個人1個T的數據就是一個EB的數據。出生缺陷,深圳市政府研究討論100萬支持我們這個項目,腫瘤,今天下午接討論100萬腫瘤的項目怎麼做,100萬心腦血管病的項目怎麼做,我60多歲的,更關心活得更長,老年的每一百萬就是一個EB的數據量。我們在生命醫學科技界沒有能力處理這個,而且這些數據的採集和搜集過程還需要機器人,需要降低成本,批量化的前提下,因為這個數據是人生的對寶貴的東西。
在過去的原子彈爆炸和登月我們都比人家落后的,人類基因組方面我們和人家是齊步的,華大作為民間機構有點虛榮心,中國的機構排名第五,生命科學排名第二,深圳基礎科學貢獻率49,我們沒有義務做基礎科研,虛榮心作祟跟人家比劃比劃,很重要的技術平台,基因分析的技術平台全部國化了,我們自己國化了,現在已經花了24億了,加上原來的十幾個億,就這個平台的建設,加上國家基因庫,加上計算,100億的平台建設,我們對在世界上處於一個強勢領先的地位。在部門上跟美國有一拼,其他的國家沒有對手,不是今天的中興,華為,聯想,從后面跟上的,我們是居高臨下打過來的,科學論文去年是49篇國際論文發表,國化的機器使得我們真正的提出為人民服務的大口號,可以在大數據,大平台實現大科學和大業的全貫穿,但是從科學到業,現在是政策法規的問題,是智能化的問題,我們遇到了這些。
過去我們非常害怕的是各種遺傳病,傳染性疾病,德國的大腸桿菌我們花了兩天的時間做出來了,前幾天的埃博拉,我們是不被報導的,在非洲的基礎平台建設是我們做的,因為我們是民間科技民工隊,是不能在國家上的,但是我們的市場很大。最后還想回到生的憂,病得少,活得長,死得快,是每個人的需求,我指活得長是120歲以上,120歲以上還要慢慢死是自己這麼自己了,我想這是人類最重大的目標,實現這個目標中,科學技術是最主要的,這中間的科學技術我們遇到最大的挑戰就是整個試驗的過程全部機器人化,全部數據分析,從基因到疾病的分析,人工智能化,這是未來最大的挑戰,我現在沒有看見哪一個數據,所謂的所有的大數據,哪一個靠近我們,連邊都沒有。我去核高院跟他們談核能的力量,他們的數據量,十分之一都到不了,航天也不如我們大,這種大數據,而且這組數據的保障,寶貴性,也是不可以相比的,未來我們自己的健康我們一起來做生命科學的大數據,謝謝大家。
上一篇
下一篇