惠每數據中臺通過打通醫(yī)院各信息系統(tǒng),對醫(yī)院數據進行全局治理,形成可共享和復用的數據資產分層模型,為醫(yī)院提供安全而開放的數據服務,有效解決數據重復利用、數據服務等問題,把數據自主管理權“還”給醫(yī)院信息科,支撐數據上報、電子病歷評級、互聯互通測評、三級醫(yī)院評審等政策要求。
醫(yī)院信息化發(fā)展到一定程度,數據自然成為關注的焦點,數據中心(注:這里指數據資源中心,而非機房等基礎設施)也成為近幾年醫(yī)院信息化建設中的“熱詞”。臨床數據中心、科研數據中心、運營數據中心、大數據中心、數據中臺等名詞林林總總、眼花繚亂,廠商對于數據中心怎么建也是各有說法。那么,對于醫(yī)院而言,應當怎樣認識各類數據中心、怎樣構建數據中心呢?認清這一問題對于醫(yī)院理順各類數據資源之間的關系、設計良好的數據架構、構建科學的數據治理體系十分重要。本文對此進行簡要的梳理分析。
一、目的不同,數據中心不同
數據中心,顧名思義,是數據的匯聚之地,目的是為了數據的應用。應用的目的與場景不同,數據中心所包含的數據內容、數據獲取方式及構建技術各不相同。
作為電子病歷核心的臨床數據中心(CDR),為醫(yī)生、護士工作站的臨床業(yè)務功能和電子病歷應用提供支撐。其數據內容主要為患者醫(yī)療相關數據,除醫(yī)生、護士工作站系統(tǒng)自身產生的數據外,還要匯集輔助科室的患者醫(yī)療數據。其數據采集方式應體現實時性。如果采用獨立的第三方臨床數據中心的構建方式,其數據采集也應以增量數據同步等近實時方式為宜。
服務于特定管理用途的數據中心,如為感染監(jiān)測、醫(yī)療質量管理、運營管理等建立的數據中心,在數據內容上要滿足其應用目的的需要,數據來源于各業(yè)務信息系統(tǒng)。數據采集可視管理上的時限要求,采用ETL定時(如每天1次)抽取的方式實現。
面向臨床科研、管理分析等數據二次利用的數據中心或大數據中心,數據內容要盡量保持全面、完整。數據采集可采用低頻度(如每月1次)的ETL方式實現。因數據檢索及分析性能的需要,底層可采用大數據技術構建。
按照服務對象的不同,上述各種數據中心可以分為兩大類。
一類是與應用系統(tǒng)綁定的數據中心。信息系統(tǒng)軟件綁定了特定的數據結構模型和數據內容,數據中心為其上的應用軟件提供服務并融為一體。比如,電子病歷系統(tǒng)依賴于特定的臨床數據中心,臨床科研數據平臺和專病數據庫依賴于特定的科研數據中心,績效考核系統(tǒng)依賴于特定的運營數據中心等。
這類數據中心又可以分為兩種情況:一種是支撐記錄型系統(tǒng)的業(yè)務數據中心,如臨床數據中心;一種是支撐數據利用型系統(tǒng)的數據中心,如科研數據中心。無論哪種情況,這一類數據中心都是隨著具體的應用系統(tǒng)由廠商而建立,不同的廠商系統(tǒng)之間其數據中心在結構模型上并不兼容,因而可稱為應用系統(tǒng)的數據中心。除了支撐廠商的應用系統(tǒng)外,這類數據中心是否對醫(yī)院開放數據訪問接口因廠商政策而異,相當一部分數據中心是封閉的,即醫(yī)院用戶只能通過廠商提供的應用系統(tǒng)來訪問數據而不能直接操作數據。
另一類是醫(yī)院的全局數據中心。這類數據中心是為醫(yī)院信息技術部門日常的數據服務工作提供平臺支撐的。就像我們看到的那樣,醫(yī)院的信息化應用除了各個應用系統(tǒng)的例行業(yè)務和常規(guī)統(tǒng)計功能以外,還有大量的隨機統(tǒng)計、數據服務、數據提取上報等應用需求。建立支撐這類需求的醫(yī)院數據中心非常必要,我們不妨把它稱作醫(yī)院的全局數據中心。這類數據中心跨越各類應用系統(tǒng),不依附于特定的應用系統(tǒng)和產品,是醫(yī)院各類數據資源的集大成之地,是醫(yī)院信息技術部門的工作平臺,其內部結構對醫(yī)院完全開放。
與應用系統(tǒng)數據中心不同,醫(yī)院全局數據中心是個性化的,因醫(yī)院的信息化建設和應用系統(tǒng)構成情況而不同,需要各醫(yī)院自行規(guī)劃。當然,醫(yī)院也可以依托廠商的技術力量進行建設。在實踐中,可以依托HIS和電子病歷的數據庫,通過數據同步復制技術構建數據中心主體,合并導入其它系統(tǒng)數據(如專科數據、人財物數據等),構建內容完整的醫(yī)院全局數據中心。
三、不同數據中心的架構關系
隨著數據利用需求和不同目的的數據應用系統(tǒng)越來越多,在一個醫(yī)院存在不同類型的數據中心會成為常態(tài),甚至是同類型的數據中心也會出現多個。例如,一個醫(yī)院可能會出現服務于不同科室的多個廠商的臨床科研平臺和科研數據中心。由于數據中心缺乏標準,這些數據中心也只是為各自的系統(tǒng)服務,無法真正成為數據的“中心”。這樣的“中心”多了,就帶來一個新問題,它們都要從業(yè)務數據庫中獲取數據。
例如,HIS數據庫既要給臨床數據中心提供數據,也要給科研數據中心、質控數據中心、運營數據中心提供數據。不管是定時抽取、觸發(fā)器還是日志增量同步,多重數據同步都會給業(yè)務系統(tǒng)數據庫增加額外的性能負擔,同時也增加了不可靠因素。
怎么樣解決這一問題?這本質上是醫(yī)院整體數據架構治理的議題??梢越梃b集成平臺的思路,集成平臺作為中轉,解決了應用系統(tǒng)之間一對多、多對多的數據交互問題。對于數據中心與業(yè)務數據庫的數據同步,可以以醫(yī)院的全局數據中心作為中轉,簡化各類數據中心與業(yè)務數據庫的同步關系。
具體做法是:把業(yè)務數據庫的數據以準實時的方式同步到醫(yī)院全局數據中心,由全局數據中心再將數據分發(fā)到各系統(tǒng)數據中心或供應用系統(tǒng)數據中心隨需抽取。除了作為各數據中心統(tǒng)一的數據源外,醫(yī)院全局數據中心同時支撐日常的數據統(tǒng)計查詢服務,并為各類數據上報任務提供原始數據。這樣的架構關系,凸顯了醫(yī)院全局數據中心的作用,最大程度地減少對業(yè)務系統(tǒng)的打擾,是醫(yī)院數據中心建設的一種可選模式。