俞國培① 包小源① 黃新霆② 劉徽① 許蓓蓓① 于娜① 張俊①
① 北京大學醫學信息學中心
② 北大醫療信息技術有限公司
摘 要 本文從數據角度描述討論了醫療健康大數據。按照不同來源醫療健康大數據可以分成醫院醫療大數據、區域服務平臺醫療健康大數據 、疾病監測大數據、自我量化大數據、網絡大數據和生物大數據等六大類。這些不同種類數據具有不同的性質、醫學價值及問題。
關鍵詞 醫療健康 大數據 數據類型 數據可利用性
中國與西方發達國家一樣,正在步入醫療健康大數據時代,現在,每時每刻都有大量新的有關疾病、醫療和健康的信息在產生和流動,并儲存于某個地方,等待著被挖掘、分析和應用。由于中國是接近于14億人口的大國,人數占全世界總人數的1/5,所以產生積累的醫學數據量,世界各國無法比擬。截止2013年11月底,全國醫療機構總數為96.2萬個(其中醫院為2.4萬個,其他醫療機構為92.3萬個),2012年全國診療人數達69億人次[1]。目前,中國的互聯網上也正在實時產生大量難以計數的關于疾病和健康的信息。特有的巨量醫療和健康數據,賦予了中國一個能接觸并深入了解更多疾病、診療和健康信息的好機會,但同時也給數據使用者帶來了更嚴峻的應用挑戰。 |
|