?昨日,大數據助力精準醫療產業沙龍在張江·中國藥谷生物醫藥創新交流中心成功舉辦。會議圍繞“大數據助力精準醫療”這一主題開展,吸引了80多位大數據相關領域的專家、企業家和從業者參與,有孚網絡作為此次會議的協辦方,有孚網絡CTO臧云峰攜有孚專有存儲云,與在座專家共同探討大數據如何助力精準醫療,現場座無虛席,干貨滿滿。
本次活動邀請了大數據、生物信息、臨床試驗、新藥研發、企業信息化等方面的研究者、技術專家和應用專家,針對精準醫療大數據目前的發展現狀、存在的問題,以及未來大數據如何推動精準醫療產業的發展進行了深入探討,推進大數據為基礎研究、臨床應用和新藥研發賦能,推動精準醫療產業發展。
自2015年宣布精準醫療計劃,發布“精準醫療”白皮書以來,精準醫療迅速成為醫學界關注的焦點。精準醫療是生物技術和信息技術在醫學臨床實踐的交匯融合應用,是醫學科技發展的前沿方向。加強精準醫療研究布局,對于加快重大疾病防控技術突破、占據未來醫學及相關產業發展主導權、打造我國生命健康產業發展的新驅動力至關重要。
作為網絡通信和云計算領域資深專家,有孚網絡CTO臧云峰主持和參與了多個大型國家A級標準數據中心建設與運營,也是國內最早的專有云概念提出者。他此次分享的主題是“專有云助力精準醫療”。在會議中,他提出:我們正在從云1.0時代向云2.0時代邁進,隨著5G的推進,云邊協同與融合逐漸成為核心,并給數據帶來了更好的儲存方式。而精準醫療是數據驅動的科學,人工智能和大數據和精準醫療的結合還處于爬坡階段,在此背景下,數據存儲面臨多方面挑戰。精準醫療專有云的設計可以確保數據有效管理與執行。
臧云峰在會議現場提到:隨著二代基因測序技術的發展,基因測序的成本超摩爾下降。未來,基因測序技術將可能在如下三個應用場景發力:精準的健康管理、癌癥早期篩查和基因編輯。精準醫療,就是以個體化醫療為基礎、隨著基因組測序技術快速進步以及生物信息與大數據科學的交叉應用而發展起來的新型醫學概念與醫療模式。
他說:每個人都有自己的基因,如果我們對這些潛在的基因數據進行分析,就能夠精準地診斷出病源。僅一個人的分析過程即可產生GB級數據,而精準醫療的充分實施將涉及對成千上萬人群數據的整合分析。同時,基于基因組學和影像學的分析正成為標準診斷過程,綜上原因,帶來的影像數據+臨床數據+基因組數據都構成了精準醫療海量數據。這些數據中80%以上為非機構化數據,這就帶來了數據在管理和運用上的困難和挑戰:
數據海量增加
一張X光片的數據量就達幾十兆,一個CT可達100MB,一個標準病理圖接近5GB,以國內醫院數量約3萬家來計,每年增長的數據總量將達到60PB-1EB之多,所以每一二年醫院存儲系統都要擴容。
數據管理周期
對于訪問頻次低的影像數據,需要合理規劃影像數據的生命周期管理以降低存儲資源的投入。
數據安全性
各影像數據都需要長期保存至少30年,且數據需要具有冗余保護機制和數據備份機制來對抗病毒等攻擊。
數據讀取速率
存儲系統需要具有良好的讀寫性能要求,滿足1MB左右PACS小文件讀寫性能。
有孚網絡以客戶對精準醫療大數據管理與運營的迫切需求為初心,利用有孚云平臺多年來在各大行業成熟的對象存儲運營經驗,提出了專屬于精準醫療大數據的數據分級存儲解決方案:根據醫療數據訪問頻率劃分為熱數據、溫數據及冷數據,將影像熱數據和溫數據存儲在有孚云存儲中,通過SSD和HDD提供更高性能的訪問速度影像;冷數據遷移到有孚藍光云,解決醫院對影像數據長期保存、數據備份的需求。數據分層轉儲可通過設置分層策略自動轉儲,或手動加自動混合策略實現。
有孚專有存儲云,通過分布式計算平臺和存儲系統,實現專門針對結構化與非結構化數據間的關聯與高效數據查詢的數據結構設計和數據組織算法設計。同時支持基于分布式系統的可擴展與高并發能力,構建信息系統和數據挖掘的基礎平臺。針對各類非結構化數據的不同特點,和由此引發的數據查詢的時間復雜度,以機器學習的方式實現高效索引。系統架構設計支持與主流機器學習引擎的無縫對接,包括數據結構和數據分布方式的兼容,為使用者定制醫療大數據應用提供良好的可擴展性。
此外,有孚專有存儲云平臺根據精準醫療大數據實際運用過程中的痛點,規劃出專有云體系架構,將基因測序的服務商、合作伙伴、實驗室、科研機構、聯盟醫院,通過專線電路互聯起來。利用這些高帶寬、高安保級別的專線,可以直接連通到有孚專有云的使用區,專有云區利用專有的計算器和存儲器,通過統一的云管平臺和業務管理平臺,管理及調度有效的資源。此外云平臺的納管功能延伸到用戶側,提升基因測序的效率。
本次沙龍在熱烈的討論中落下帷幕,現場提問踴躍,專家傾囊相授,參會者意猶未盡。為精準醫療的發展做出了一次有益的探討,有孚網絡今后也將持續助力精準醫療行業向前邁步。