應(yīng)用需求決定平臺(tái)架構(gòu),平臺(tái)架構(gòu)決定基礎(chǔ)架構(gòu)。三甲醫(yī)院大數(shù)據(jù)應(yīng)用場(chǎng)景主要分成臨床、運(yùn)營(yíng)、科研三大類(lèi),分別對(duì)應(yīng)臨床數(shù)據(jù)中心(CDR),運(yùn)營(yíng)數(shù)據(jù)中心(ODR)和科研數(shù)據(jù)中心(RDR),臨床數(shù)據(jù)以電子病歷為核心,目前隨著結(jié)構(gòu)化電子病歷的普及,純文本的數(shù)據(jù)越來(lái)越少,NLP的技術(shù)依然適合,運(yùn)營(yíng)數(shù)據(jù)則大多數(shù)為結(jié)構(gòu)化數(shù)據(jù),科研數(shù)據(jù)則在臨床數(shù)據(jù)的基礎(chǔ)上有更多的多媒體數(shù)據(jù)(多數(shù)為影像數(shù)據(jù))、實(shí)驗(yàn)數(shù)據(jù)和隨訪數(shù)據(jù)。大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)設(shè)計(jì)需要支撐上述需求的實(shí)現(xiàn),計(jì)算能力、存儲(chǔ)能力和安全是基礎(chǔ)架構(gòu)建設(shè)的三個(gè)重要方面。計(jì)算能力主要在數(shù)據(jù)采集、預(yù)處理、實(shí)時(shí)計(jì)算和分析階段進(jìn)行支持。存儲(chǔ)能力則是支持分析數(shù)據(jù)所需要存儲(chǔ)資源和存儲(chǔ)空間的支持。三甲醫(yī)院大數(shù)據(jù)平臺(tái)大多數(shù)基于Hadoop等分布式平臺(tái),采用內(nèi)存數(shù)據(jù)庫(kù)或圖數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)存儲(chǔ)。
為幫助三甲醫(yī)院用戶(hù)更好地建設(shè)大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu),專(zhuān)家與醫(yī)院同行一起從四個(gè)角度出發(fā)交流,供更多同行參考,包括:基于臨床、運(yùn)營(yíng)和科研大數(shù)據(jù)平臺(tái)的內(nèi)容和要求角度、基于醫(yī)院大數(shù)據(jù)平臺(tái)建設(shè)的技術(shù)架構(gòu)角度、基于大數(shù)據(jù)平臺(tái)建設(shè)標(biāo)準(zhǔn)和目標(biāo)角度、基于大數(shù)據(jù)的存儲(chǔ)規(guī)劃角度,以及交流達(dá)成的共識(shí)總結(jié)。
通過(guò)本場(chǎng)醫(yī)院同行的交流活動(dòng)達(dá)成了一些交流共識(shí)如下,僅供參考:
(1)從大數(shù)據(jù)平臺(tái)建設(shè)內(nèi)容方面來(lái)說(shuō),醫(yī)院大數(shù)據(jù)平臺(tái)圍繞臨床、運(yùn)營(yíng)以及科研等三個(gè)主要層面進(jìn)行,新技術(shù),新手段也都需要圍繞這三個(gè)方面,因此,CDR、ODR、RDR的建設(shè)應(yīng)該說(shuō)是囊括了醫(yī)院信息化大數(shù)據(jù)平臺(tái)的主要內(nèi)容。(2)從技術(shù)架構(gòu)角度來(lái)說(shuō),基于分布式存儲(chǔ)的架構(gòu)平臺(tái)似乎成為主流,但是目前正在逐步從分布式過(guò)渡到云,主要以醫(yī)院的私有云+公有云的混合模式出現(xiàn)。(3)從建設(shè)標(biāo)準(zhǔn)和目標(biāo)角度,大數(shù)據(jù)平臺(tái)應(yīng)具有異構(gòu)數(shù)據(jù)的標(biāo)準(zhǔn)化,數(shù)據(jù)處理流程,分析過(guò)程標(biāo)準(zhǔn)化的功能,同時(shí),數(shù)據(jù)可視化也應(yīng)是目標(biāo)之一。(4)從數(shù)據(jù)存存儲(chǔ)選型角度,混合SSD和傳統(tǒng)SATA的存儲(chǔ)器搭建SAN網(wǎng)絡(luò)是一種路線,分布式存儲(chǔ)的效果主要體現(xiàn)在不少醫(yī)院早些年建成的基于Hadoop架構(gòu)。從科研平臺(tái)未來(lái)的發(fā)展看,采用支持Hadoop的分布式存儲(chǔ),實(shí)現(xiàn)計(jì)算與存儲(chǔ)的分離,是未來(lái)的一個(gè)趨勢(shì)。一、基于臨床、運(yùn)營(yíng)和科研大數(shù)據(jù)平臺(tái)的內(nèi)容和要求角度
1、三甲醫(yī)院大數(shù)據(jù)平臺(tái)如何建設(shè),才能滿足具有多模態(tài),異構(gòu)化,海量化的臨床、運(yùn)營(yíng)以及科研數(shù)據(jù)的整合?
【問(wèn)題描述】眾所周知,三級(jí)醫(yī)院經(jīng)過(guò)十幾年、幾十年的信息化建設(shè),已經(jīng)建設(shè)成為具有臨床數(shù)據(jù)支撐,科研支撐,以及運(yùn)營(yíng)支撐的全方位信息化應(yīng)用的場(chǎng)景,但是隨著大數(shù)據(jù)分析廣泛應(yīng)用,海量數(shù)據(jù)的整合挖掘及再利用也提上日程,部分醫(yī)院走在了前列,但是在開(kāi)展的過(guò)程中遇到了不少問(wèn)題,比如,數(shù)據(jù)的模式的多樣性造成了對(duì)數(shù)據(jù)使用的難點(diǎn)。醫(yī)療數(shù)據(jù)中包含了文本,圖像,視頻等,還有不同模式的數(shù)據(jù)。如何將這些數(shù)據(jù)整合利用,以便發(fā)揮數(shù)據(jù)的最大利用價(jià)值成為目前醫(yī)療大數(shù)據(jù)平臺(tái)的研究方向之一?@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:數(shù)據(jù)的多模態(tài)、異構(gòu)化、海量化必然導(dǎo)致其支撐架構(gòu)的多樣性。哪些數(shù)據(jù)適合關(guān)系型數(shù)據(jù)庫(kù),哪些數(shù)據(jù)適合分布式數(shù)據(jù)庫(kù),存儲(chǔ)的選擇亦是如此,也要結(jié)合數(shù)據(jù)類(lèi)型,數(shù)據(jù)的重要性、時(shí)效性要求以及業(yè)務(wù)的實(shí)際要求等因素綜合考慮。數(shù)據(jù)的整合利用離不開(kāi)如下幾個(gè)方面的工作:
1、大數(shù)據(jù)平臺(tái)需求與多元化采集數(shù)據(jù)源的梳理;2、數(shù)據(jù)的標(biāo)準(zhǔn)化規(guī)范化治理;4、數(shù)據(jù)的知識(shí)化社會(huì)化的應(yīng)用。@spgoall 和祐國(guó)際醫(yī)院 信息管理部部長(zhǎng):可以考慮先建立數(shù)據(jù)湖,把數(shù)據(jù)整合后,再按主題做篩選和清洗。
2、信息部門(mén)該如何規(guī)劃CDR、ODR、RDR的裸金層?
【問(wèn)題描述】當(dāng)前建設(shè)CDR、ODR、RDR數(shù)據(jù)中心是醫(yī)療圈熱門(mén)的話題,信息部門(mén)該如何規(guī)劃CDR、ODR、RDR的裸金層,一次把基礎(chǔ)架構(gòu)搭建立起來(lái),避免重復(fù)建設(shè)?@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:目前,CDR、ODR、RDR的定位和作用醫(yī)療圈是有共識(shí)的,但是其建設(shè)方式、模式及數(shù)據(jù)交互方式尚處于百花齊放的階段。不同的公司有各自的解決方案,不同的醫(yī)院和機(jī)構(gòu)也根據(jù)自己實(shí)際業(yè)務(wù)的需求和特點(diǎn)進(jìn)行著有針對(duì)性的建設(shè),所以我理解因?yàn)槠浣ㄔO(shè)的非標(biāo)準(zhǔn)化特性,希望有一種規(guī)劃、或者一種模式把基礎(chǔ)架構(gòu)搭建起來(lái),然后后續(xù)不再變動(dòng),不再調(diào)整,從而避免重復(fù)建設(shè),這種本身是與信息化技術(shù)與發(fā)展的日新月異的特性和特點(diǎn)相違背的。當(dāng)下,數(shù)字中國(guó)日益提上日程、物聯(lián)網(wǎng)、5G的快速應(yīng)用、區(qū)塊鏈、數(shù)字孿生、人工智能等新技術(shù)與醫(yī)療的融合也將日益緊密,數(shù)據(jù)中臺(tái)的討論也不絕于耳。所以CDR、ODR、RDR這種適合當(dāng)下的數(shù)據(jù)層架構(gòu)和方法論是否適合未來(lái)3-5年的技術(shù)發(fā)展尚不可知,所以其基礎(chǔ)架構(gòu)的不確定性也更加不能形成定論。目前就CDR、ODR、RDR的建設(shè)而言,個(gè)人覺(jué)得,應(yīng)該把握幾個(gè)建設(shè)原則:(1)分類(lèi)原則。不管技術(shù)如何發(fā)展,架構(gòu)如何調(diào)整,數(shù)據(jù)的分類(lèi)應(yīng)該是不會(huì)有太大的調(diào)整。結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化,其適宜的存儲(chǔ)架構(gòu)是有明確的規(guī)范和要求的,數(shù)據(jù)的重要性與否,數(shù)據(jù)的響應(yīng)時(shí)效要求,數(shù)據(jù)容災(zāi)要求,這些都是數(shù)據(jù)分類(lèi)的具體指標(biāo),也為我們底層架構(gòu)的建設(shè)提供指引,避免低需高配和高需低配的情況出現(xiàn),保證需求和配置的相適宜;所以針對(duì)不同數(shù)據(jù)類(lèi)型和數(shù)據(jù)要求,要有與之相適應(yīng)的存儲(chǔ)底層,故數(shù)據(jù)中心的裸金層也是存在多種架構(gòu)存在的。(2)可擴(kuò)展原則。CDR、ODR和RDR,在建設(shè)初期,因?yàn)樾枨蟮牟幻鞔_、中心數(shù)據(jù)的磨合、與各業(yè)務(wù)系統(tǒng)的交互和上層應(yīng)用的梳理等原因,前期數(shù)據(jù)體量不會(huì)太大,隨著業(yè)務(wù)的推進(jìn),技術(shù)、流程和方法的日趨成熟,需求也會(huì)處于井噴期,其數(shù)據(jù)增長(zhǎng)也會(huì)指數(shù)型增長(zhǎng),原來(lái)的架構(gòu)應(yīng)該要充分考慮其可擴(kuò)展性,以及擴(kuò)展后保證數(shù)據(jù)性能、數(shù)據(jù)時(shí)效響應(yīng)等方面不會(huì)下降。
3、醫(yī)療大數(shù)據(jù)方面如何解決數(shù)據(jù)孤島和數(shù)據(jù)安全問(wèn)題?
【問(wèn)題描述】在醫(yī)療數(shù)據(jù)收集方面存在很多檢查設(shè)備,例如:纖支鏡 等單設(shè)備無(wú)法提取數(shù)據(jù)的問(wèn)題。大數(shù)據(jù)處理過(guò)程中,如何保障數(shù)據(jù)的安全,以及隱私隱私問(wèn)題?@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:目前,的確存在很多單體設(shè)備的數(shù)據(jù)提取、存儲(chǔ)的問(wèn)題,尤其是對(duì)一些專(zhuān)有設(shè)備如 纖支鏡 、腦電圖等,這些數(shù)據(jù)的采集要相應(yīng)的設(shè)備廠家能開(kāi)放相應(yīng)的數(shù)據(jù)接口,目前很多這些設(shè)備的廠家基本都會(huì)有自己開(kāi)發(fā)的系統(tǒng),也有一些廠家會(huì)開(kāi)發(fā)相應(yīng)的系統(tǒng),對(duì)市面上的比較高占有率的產(chǎn)品類(lèi)型進(jìn)行數(shù)據(jù)的提取開(kāi)發(fā)。所以建議在采購(gòu)該類(lèi)設(shè)備的時(shí)候,一定要注意關(guān)注數(shù)據(jù)提取這塊,數(shù)據(jù)接口是否開(kāi)放?通過(guò)特定數(shù)據(jù)線抑或是網(wǎng)絡(luò)傳輸?是否要專(zhuān)有信息系統(tǒng)抑或是市面上有可以統(tǒng)一匯集提取的軟件?這些都要考慮并且也要寫(xiě)入采購(gòu)合同中。大數(shù)據(jù)處理要嚴(yán)格執(zhí)行等保2.0的相關(guān)要求,數(shù)據(jù)的處理可以通過(guò)堡壘機(jī)等安全措施進(jìn)行操作,另外可以通過(guò)脫敏設(shè)備對(duì)敏感數(shù)據(jù)進(jìn)行脫敏,并且形成相應(yīng)的規(guī)范流程便于操作。數(shù)據(jù)安全要重視設(shè)備的投入、人員的管理、技術(shù)的提升,也要關(guān)注架構(gòu)的合理、流程的規(guī)范、舉措的到位。@spgoall 和祐國(guó)際醫(yī)院 信息管理部部長(zhǎng):檢查設(shè)備數(shù)據(jù)傳輸問(wèn)題還是設(shè)備本身是否支持?jǐn)?shù)據(jù)輸出接口,這個(gè)需要聯(lián)合設(shè)備科在購(gòu)買(mǎi)設(shè)備的時(shí)候就要把數(shù)據(jù)傳輸接口需求寫(xiě)入招標(biāo)文件。大數(shù)據(jù)處理過(guò)程中的數(shù)據(jù)安全也應(yīng)該基于三級(jí)等保2.0的要求嚴(yán)格執(zhí)行,隱私問(wèn)題還要增加動(dòng)態(tài)脫敏、數(shù)據(jù)庫(kù)防火墻等設(shè)備
4、關(guān)于科研大數(shù)據(jù)平臺(tái)底層基礎(chǔ)架構(gòu)
【問(wèn)題描述】科研大數(shù)據(jù)平臺(tái)現(xiàn)在發(fā)展方向主要有四個(gè)方向:影像,大樣本分析,多模態(tài),真實(shí)世界研究,目前以真實(shí)世界研究居多,但是趨勢(shì)是往多模態(tài)方向發(fā)展,這就要求傳統(tǒng)的文本,結(jié)構(gòu)化數(shù)據(jù)處理外,還需要結(jié)合影像圖片,甚至是超聲之類(lèi)的視頻,對(duì)于這類(lèi)數(shù)據(jù)處理,底層基礎(chǔ)架構(gòu)如何支撐?@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:存儲(chǔ)層面可以考慮分布式存儲(chǔ)、對(duì)象存儲(chǔ)等方式;數(shù)據(jù)層面可以考慮分布式數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)等方式。
5、三甲醫(yī)院科研大數(shù)據(jù)平臺(tái)應(yīng)該具備哪些主要功能?
【問(wèn)題描述】結(jié)合現(xiàn)今人工智能,數(shù)據(jù)科學(xué)的流行,三甲醫(yī)院對(duì)科研的發(fā)展愈加的重視,對(duì)于一個(gè)能夠完美支撐三甲醫(yī)院科研的數(shù)據(jù)平臺(tái)是非常必要的,但是從業(yè)務(wù)和建設(shè)者角度來(lái)看,臨床科研的需求和計(jì)算機(jī)專(zhuān)業(yè)從業(yè)者之間對(duì)于技術(shù)平臺(tái)的理解還有一定的差異,那么科研平臺(tái)應(yīng)該具有什么樣的功能,才能滿足或推動(dòng)臨床科研的進(jìn)一步發(fā)展十分重要,這也是具備信息技術(shù)的從業(yè)人員需要搞清楚的問(wèn)題。@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:科研平臺(tái)作為醫(yī)院科研領(lǐng)域重要的業(yè)務(wù)平臺(tái),要結(jié)合科研業(yè)務(wù)的特點(diǎn)進(jìn)行功能的設(shè)計(jì)。因?yàn)榭蒲袠I(yè)務(wù)的復(fù)雜性和多樣性,所以也就導(dǎo)致科研平臺(tái)的功能是十分復(fù)雜、十分多樣的成體系的存在。但是幾個(gè)大的功能科研平臺(tái)還是應(yīng)該具備的:1、數(shù)據(jù)的查詢(xún)和提取功能。科研業(yè)務(wù)的重要對(duì)象就是對(duì)數(shù)據(jù)的分析,針對(duì)某一科研項(xiàng)目需求,能從平臺(tái)中查詢(xún)并提取出研究所需要的數(shù)據(jù),這個(gè)應(yīng)該是平臺(tái)必備的功能;2、科研信息圖譜的查詢(xún)??蒲袠I(yè)務(wù)在開(kāi)展前,需要進(jìn)行回顧性分析,對(duì)前人類(lèi)似的科研業(yè)務(wù)、文獻(xiàn)、網(wǎng)絡(luò)資源等進(jìn)行綜合性查詢(xún)和分析,能讓研究者了解該研究的整體的信息圖譜,為本次科研項(xiàng)目研究提供有效信息支撐;3、科研人員圖譜查詢(xún)。要做好科研,要有合適的對(duì)的人參與進(jìn)來(lái)或者進(jìn)行相關(guān)業(yè)務(wù)的合作,科研平臺(tái)能全方位的展示相關(guān)人員的科研信息,為科研人員提供選擇參考將有利于科研項(xiàng)目的推進(jìn)。
6、醫(yī)院科研大數(shù)據(jù)平臺(tái),如何對(duì)臨床醫(yī)生真正有所幫助,無(wú)論是數(shù)據(jù)還是圖像?
@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:任何技術(shù)手段、架構(gòu)、方法、系統(tǒng)抑或是平臺(tái),包括醫(yī)院科研大數(shù)據(jù)平臺(tái)也是如此,其目標(biāo)都是結(jié)合業(yè)務(wù)對(duì)數(shù)據(jù)、流程、模式等進(jìn)行再組織,從而實(shí)現(xiàn)用戶(hù)既定目標(biāo)。系統(tǒng)平臺(tái)的建設(shè),表面看是信息化層面的建設(shè),但是其實(shí)質(zhì)是業(yè)務(wù)流程的再造、知識(shí)的再重組梳理、數(shù)據(jù)的再組織,結(jié)合技術(shù)的特點(diǎn)和優(yōu)勢(shì),從而實(shí)現(xiàn)業(yè)務(wù)自動(dòng)化乃至智能化。所以如果系統(tǒng)和平臺(tái)要建的好,相應(yīng)用戶(hù)如臨床醫(yī)生的深度參與是密不可分,需求目標(biāo)要能明確提出、功能體系要充分驗(yàn)證,數(shù)據(jù)質(zhì)量要監(jiān)控把關(guān),只有這樣,醫(yī)院科研大數(shù)據(jù)平臺(tái)的建設(shè)才能實(shí)現(xiàn)為臨床醫(yī)生提供真正意義上,有感的幫助。二、基于醫(yī)院大數(shù)據(jù)平臺(tái)建設(shè)的技術(shù)架構(gòu)角度
1、互聯(lián)網(wǎng)醫(yī)院的建設(shè)中,如何規(guī)劃大數(shù)據(jù)平臺(tái)的架構(gòu)?
@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:按照衛(wèi)健委發(fā)布的《互聯(lián)網(wǎng)醫(yī)院管理辦法(試行)》,互聯(lián)網(wǎng)醫(yī)院包括作為實(shí)體醫(yī)療機(jī)構(gòu)第二名稱(chēng)的互聯(lián)網(wǎng)醫(yī)院,以及依托實(shí)體醫(yī)療機(jī)構(gòu)獨(dú)立設(shè)置的互聯(lián)網(wǎng)醫(yī)院?;ヂ?lián)網(wǎng)醫(yī)院作為互聯(lián)網(wǎng)+醫(yī)療的組織表現(xiàn)形式,不管是哪種形式的互聯(lián)網(wǎng)醫(yī)院,其業(yè)態(tài)是目前為止是一定的,如我們熟知的預(yù)約掛號(hào)、在線繳費(fèi)、在線查詢(xún)檢驗(yàn)檢查報(bào)告、在線入出院等。隨著互聯(lián)網(wǎng)+醫(yī)療的深入結(jié)合,其服務(wù)模式等也會(huì)有相應(yīng)創(chuàng)新性的發(fā)展。規(guī)劃互聯(lián)網(wǎng)醫(yī)院的大數(shù)據(jù)平臺(tái)架構(gòu)時(shí),要充分考慮互聯(lián)網(wǎng)醫(yī)院現(xiàn)有業(yè)務(wù)模式下的數(shù)據(jù)概況,也要充分預(yù)留未來(lái)互聯(lián)網(wǎng)+醫(yī)療業(yè)務(wù)爆炸式、井噴式發(fā)展時(shí),基礎(chǔ)架構(gòu)的可擴(kuò)展性、靈活度要能與之適配。
2、基礎(chǔ)架構(gòu)與醫(yī)院信息系統(tǒng)的融合問(wèn)題?
【問(wèn)題描述】如果醫(yī)院已經(jīng)建立集成平臺(tái),但缺乏專(zhuān)業(yè)的臨床科研數(shù)據(jù)平臺(tái),怎樣將科研,管理,臨床平臺(tái)與現(xiàn)有集成平臺(tái)融合?;A(chǔ)架構(gòu)與新建信息平臺(tái)的融合!@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:首先,應(yīng)該要先理清各平臺(tái)的定位和作用,以及我們需要實(shí)現(xiàn)的目標(biāo)。集成平臺(tái)是為了解決醫(yī)院系統(tǒng)間星狀交互導(dǎo)致的各類(lèi)問(wèn)題而提出來(lái)的系統(tǒng)交互平臺(tái),其目標(biāo)在于實(shí)現(xiàn)系統(tǒng)間的互聯(lián)互通,系統(tǒng)間的互聯(lián)互通主要是通過(guò)平臺(tái)的標(biāo)準(zhǔn)化接口實(shí)現(xiàn)。科研、管理、臨床作為醫(yī)院不同的業(yè)務(wù)領(lǐng)域,其實(shí)際業(yè)務(wù)目標(biāo)是不相同的。又因?yàn)檫@三大業(yè)務(wù)領(lǐng)域中的具體業(yè)務(wù)各式各樣,所以業(yè)務(wù)系統(tǒng)數(shù)量和種類(lèi)也是多而雜。集成平臺(tái)可以解決臨床、科研和管理等業(yè)務(wù)領(lǐng)域各類(lèi)系統(tǒng)互聯(lián)、數(shù)據(jù)交互共享的問(wèn)題,但是如果是臨床、科研、管理等業(yè)務(wù)系統(tǒng)的數(shù)據(jù)的融合利用,則需要通過(guò)CDR、ODR、RDR等各類(lèi)數(shù)據(jù)中心去實(shí)現(xiàn),通過(guò)對(duì)邏輯數(shù)據(jù)的治理、存儲(chǔ)、利用,充分發(fā)揮數(shù)據(jù)資源的價(jià)值。
3、大數(shù)據(jù)平臺(tái)底層架構(gòu)規(guī)劃?
【問(wèn)題描述】大數(shù)據(jù)平臺(tái)架構(gòu)需要數(shù)據(jù)存儲(chǔ)和計(jì)算能力。醫(yī)療數(shù)據(jù)是多源異構(gòu)的,有結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化,同時(shí)隨著未來(lái)物聯(lián)網(wǎng)、設(shè)備等數(shù)據(jù)的增長(zhǎng),對(duì)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)存儲(chǔ)要求會(huì)更高;大數(shù)據(jù)平臺(tái)需要滿足各種AI能力,這部分體現(xiàn)在算力上,算力需要的軟件和硬件兩個(gè)層面的支撐。綜上,在建設(shè)大數(shù)據(jù)平臺(tái)的時(shí)候,做好應(yīng)用的規(guī)劃的同時(shí),也需要充分規(guī)劃好底層基礎(chǔ)架構(gòu),底層基礎(chǔ)架構(gòu)需要滿足先進(jìn)性、成熟性、使用性、開(kāi)放性、和擴(kuò)充性。問(wèn)題:如何做好這部分規(guī)劃?@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:個(gè)人覺(jué)得對(duì)于大數(shù)據(jù)平臺(tái)的底層基礎(chǔ)架構(gòu),也應(yīng)該根據(jù)其上層的應(yīng)用類(lèi)型、數(shù)據(jù)類(lèi)型、時(shí)效要求、容災(zāi)要求等綜合考慮選取合適的,與之相適應(yīng)的底層架構(gòu)?;\統(tǒng)的把整個(gè)大數(shù)據(jù)平臺(tái)放在某一種架構(gòu)中,不考慮其實(shí)際情況,將容易導(dǎo)致資源利用與實(shí)際需求的不相符。大數(shù)據(jù)平臺(tái)的數(shù)據(jù)類(lèi)型及業(yè)務(wù)場(chǎng)景都是多種多樣的,與之相適應(yīng)的,底層基礎(chǔ)架構(gòu)也應(yīng)該進(jìn)行分類(lèi)討論。就存儲(chǔ)底層而言,存儲(chǔ)IO要求高的,結(jié)構(gòu)化的數(shù)據(jù)則應(yīng)該用ssd全閃乃至NVMe全閃,要求不高,數(shù)據(jù)量較大,非結(jié)構(gòu)化的數(shù)據(jù),則應(yīng)該考慮其他類(lèi)型的存儲(chǔ)、分布式存儲(chǔ)乃至對(duì)象存儲(chǔ)架構(gòu)。@陳建 武漢市中心醫(yī)院 系統(tǒng)運(yùn)維工程師: 大數(shù)據(jù)平臺(tái)的底層架構(gòu)主要是3個(gè)方面:數(shù)據(jù)的存儲(chǔ)、算力和算法,在這之上來(lái)支撐數(shù)據(jù)的應(yīng)用,反哺業(yè)務(wù)。
4、三甲醫(yī)院大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)?
【問(wèn)題描述】應(yīng)用需求決定平臺(tái)架構(gòu),平臺(tái)架構(gòu)決定基礎(chǔ)架構(gòu),說(shuō)明醫(yī)院尤其是大型三甲醫(yī)院大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)是很重要的,我的問(wèn)題是針對(duì)醫(yī)院不同類(lèi)型的數(shù)據(jù)類(lèi)型,要充分考慮醫(yī)院數(shù)據(jù)的存儲(chǔ)方式和存儲(chǔ)能力,同時(shí)還要考慮系統(tǒng)的計(jì)算能力,這是建設(shè)基礎(chǔ)架架的前提,希望有這方面建設(shè)的實(shí)例針對(duì)性的分析,謝謝。@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:目前很多醫(yī)院在建設(shè)基礎(chǔ)架構(gòu)時(shí),正在逐步云化過(guò)渡,有些在建自己的私有云,有一些會(huì)將一些業(yè)務(wù)放在公有云,都在做相應(yīng)的積極探索,當(dāng)然有利有弊。在醫(yī)院基礎(chǔ)架構(gòu)云化的大背景下,我們?cè)诮ㄔO(shè)時(shí)應(yīng)該要以池的概念去綜合考慮計(jì)算、存儲(chǔ)以及業(yè)務(wù)的問(wèn)題?,F(xiàn)在很多醫(yī)院都是區(qū)分內(nèi)外網(wǎng),并且系統(tǒng)都做了不同程度的容災(zāi),還有很多系統(tǒng)正在上線開(kāi)發(fā),需要大量的測(cè)試環(huán)境,還有很多對(duì)外交互的業(yè)務(wù)需要在DMZ區(qū),如醫(yī)保、支付寶、銀聯(lián)支付等。所以從業(yè)務(wù)層面來(lái)劃分,可以分為內(nèi)網(wǎng)云、外網(wǎng)云、對(duì)外交互云、測(cè)試云、容災(zāi)云。而針對(duì)不同云的特點(diǎn)要求,可以選取不同級(jí)別、不同性能、不同容量的設(shè)備和技術(shù)體系進(jìn)行支撐,重要的、穩(wěn)定性要求高的、時(shí)延要求小的用高性能高可靠的架構(gòu)體系,非結(jié)構(gòu)化、數(shù)據(jù)量大,訪問(wèn)頻率低的,可以考慮分布式存儲(chǔ)或?qū)ο蟠鎯?chǔ),以此類(lèi)推。另外計(jì)算和存儲(chǔ)能力,在云化下,針對(duì)性的進(jìn)行池化分析,計(jì)算池是否滿足計(jì)算要求,是否有GPU計(jì)算需求等,都要結(jié)合業(yè)務(wù)去具體分析,容量池亦是如此,在此不再贅述。
5、醫(yī)療大數(shù)據(jù)平臺(tái)不同的建設(shè)路線底層基礎(chǔ)架構(gòu)設(shè)計(jì)時(shí)有什么要求?
【問(wèn)題描述】目前醫(yī)療大數(shù)據(jù)平臺(tái)大多采用HADOOP+MapReduce、內(nèi)存數(shù)據(jù)庫(kù)(以SAP HANA為代表的)以及圖數(shù)據(jù)庫(kù)(GP為代表),這幾種模式在底層基礎(chǔ)架構(gòu)構(gòu)設(shè)計(jì)時(shí)有何區(qū)別?@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:底層基礎(chǔ)架構(gòu)設(shè)計(jì)不僅要考慮技術(shù)因素(性能、一致性要求、SQL兼容性要求),也要考慮包括架構(gòu)產(chǎn)品的生態(tài)成熟度、應(yīng)用架構(gòu)適配度、團(tuán)隊(duì)適應(yīng)度等非技術(shù)因素。Hadoop+MapReduce是典型的分布式文件系統(tǒng)+分布式計(jì)算的技術(shù)框架,其組件HDFS就是典型的分布式存儲(chǔ)架構(gòu),分布式存儲(chǔ)架構(gòu)更為適合其技術(shù)體系。內(nèi)存數(shù)據(jù)庫(kù)其主要的設(shè)計(jì)目標(biāo)是為了解決高并發(fā)低時(shí)延的數(shù)據(jù)管理需求,依靠?jī)?nèi)存來(lái)存儲(chǔ)數(shù)據(jù)。從存儲(chǔ)速度來(lái)說(shuō),CPU寄存器>CPU緩存>DDR DRAM>持久型內(nèi)存>NAND SSD>磁盤(pán)驅(qū)動(dòng)器(HDD)>磁帶,內(nèi)存數(shù)據(jù)應(yīng)該使用DDR DRAM或持久型存儲(chǔ),區(qū)別在于DRAM目前為易失性存儲(chǔ),使用時(shí)速度較高,但是應(yīng)該要充分考慮業(yè)務(wù)類(lèi)型和備份容災(zāi)方案,保證在極端情況下業(yè)務(wù)業(yè)務(wù)連續(xù)性,持久型內(nèi)存相對(duì)來(lái)說(shuō)速度較慢,但是非易失,容量和價(jià)格也占優(yōu)勢(shì)。圖數(shù)據(jù)庫(kù)根據(jù)其圖存儲(chǔ)和處理方式分為不同類(lèi)型,其底層的存儲(chǔ)架構(gòu)也要視圖數(shù)據(jù)庫(kù)采用的技術(shù)類(lèi)型而選擇與之適應(yīng)的存儲(chǔ)類(lèi)別。另外,值得提出的是,不管是何種存儲(chǔ)架構(gòu),要注意存儲(chǔ)的物理塊要與文件系統(tǒng)或數(shù)據(jù)庫(kù)中的邏輯塊大小上要適配,減少同一數(shù)據(jù)操作頻次。而且在基礎(chǔ)架構(gòu)設(shè)計(jì)時(shí),也要關(guān)注業(yè)務(wù)類(lèi)型、成本和投入的影響。
6、醫(yī)療大數(shù)據(jù)平臺(tái)在做存儲(chǔ)容量的規(guī)劃時(shí)應(yīng)考慮哪些因素?
@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:(1)業(yè)務(wù)的需求及增長(zhǎng)預(yù)期:要考慮現(xiàn)存數(shù)據(jù)的體量以及未來(lái)3-5年業(yè)務(wù)數(shù)據(jù)的增長(zhǎng)量;(2)數(shù)據(jù)的保存周期:數(shù)據(jù)保存期限多久,基礎(chǔ)數(shù)據(jù),過(guò)程數(shù)據(jù)、結(jié)果數(shù)據(jù)等類(lèi)型數(shù)據(jù)的比例如何?保存周期的要求如何?(3)架構(gòu)及容災(zāi)要求:是集中式架構(gòu)?還是分布式架構(gòu)?選擇的存儲(chǔ)產(chǎn)品的存儲(chǔ)內(nèi)部組織方式如何?集中式架構(gòu)是否包括RAID抑或是全局打散?RAID的劃分要求、熱備盤(pán)的要求如何?分布式架構(gòu)高可用要求如何?副本如何配置?容災(zāi)要求如何,備份方式如何選擇?全備、差異,備份的方式、頻率及備份的保存周期如何?(一)推算業(yè)務(wù)系統(tǒng)的容量需求(1)業(yè)務(wù)的數(shù)據(jù)量預(yù)估,比如每周、每月、每年數(shù)據(jù)增量。(3)數(shù)據(jù)分析需要多少個(gè)副本,全量的還是差異量的副本。(4)是否有備份、容災(zāi)的需求,備份頻率、保存周期等。(二)推算存儲(chǔ)設(shè)備該買(mǎi)多少盤(pán)(1)硬盤(pán)的進(jìn)制一般是1000進(jìn)制,操作系統(tǒng)是1024,需要折算一下單盤(pán)容量。(2)存儲(chǔ)設(shè)備的數(shù)據(jù)冗余方式,多副本還是EC/RAID?根據(jù)校驗(yàn)盤(pán)的比例來(lái)算裸盤(pán)數(shù)量。(3)還要查看所選中的存儲(chǔ)系統(tǒng)自己存儲(chǔ)元數(shù)據(jù)會(huì)消耗多少硬盤(pán)空間,把這部分扣除才是系統(tǒng)可用容量。(4)算了RAID/EC以后存儲(chǔ)可提供的容量以后,一般還要考慮加一個(gè)經(jīng)驗(yàn)系數(shù),比如10%或者20%的余量,作為風(fēng)險(xiǎn)余量。主要是小文件一般都有寫(xiě)放大。三、基于大數(shù)據(jù)平臺(tái)建設(shè)標(biāo)準(zhǔn)和目標(biāo)角度
1、醫(yī)療大數(shù)據(jù)團(tuán)隊(duì)如何建設(shè)?
【問(wèn)題描述】對(duì)于醫(yī)院建立醫(yī)療大數(shù)據(jù),如何組建團(tuán)隊(duì),需要哪些方面的人,如何建立標(biāo)準(zhǔn)操作規(guī)范,如何確定目標(biāo)方向?如何考核和推進(jìn)工作?@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:團(tuán)隊(duì)的建設(shè)要包含如下類(lèi)型的人才:(1)管理人才:有較高的管理素養(yǎng),熟悉醫(yī)療大數(shù)據(jù)的業(yè)務(wù)方向和發(fā)展趨勢(shì),能團(tuán)結(jié)團(tuán)隊(duì)人員朝著目標(biāo)努力和推進(jìn)工作;(2)技術(shù)人才:包括懂標(biāo)準(zhǔn)規(guī)范方面、大數(shù)據(jù)技術(shù)能力(架構(gòu)的設(shè)計(jì)、搭建、開(kāi)發(fā)、應(yīng)用等)等多方面大數(shù)據(jù)所需人才。(3)數(shù)據(jù)治理人才:包括了解業(yè)務(wù),有較強(qiáng)的數(shù)據(jù)治理能力、數(shù)據(jù)處理能力和分析挖掘能力等的人才;標(biāo)準(zhǔn)操作規(guī)范的確立要結(jié)合業(yè)務(wù)流,形成本團(tuán)隊(duì)操作SOP,結(jié)合行業(yè)的研究熱點(diǎn)、技術(shù)趨勢(shì)以及本單位醫(yī)療數(shù)據(jù)、人員等優(yōu)勢(shì),確立目標(biāo)方向,目標(biāo)的確定可以分為近期目標(biāo)和遠(yuǎn)期目標(biāo),通過(guò)目標(biāo)的逐步實(shí)現(xiàn)慢慢積累經(jīng)驗(yàn),逐步深入,進(jìn)而確定遠(yuǎn)期及戰(zhàn)略性目標(biāo)。考核工作應(yīng)該以人為主體維度,推進(jìn)工作應(yīng)以事或項(xiàng)目為主體維度,形成行之有效的績(jī)效考核目標(biāo)、成立項(xiàng)目推進(jìn)工作組等相關(guān)臨時(shí)組織,制定任務(wù)明晰、目標(biāo)明確的責(zé)任任務(wù)清單,將任務(wù)具體分解,落實(shí)到人,進(jìn)而形成合理共同推進(jìn)相關(guān)工作。
2、臨床數(shù)據(jù)中心必須符合醫(yī)院的數(shù)據(jù)管理規(guī)范?
@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:無(wú)規(guī)不成方圓,標(biāo)準(zhǔn)化、規(guī)范化將極大促進(jìn)數(shù)據(jù)交互共享及后期的分析挖掘利用。所以臨床數(shù)據(jù)中心的建設(shè)必須要符合數(shù)據(jù)管理規(guī)范,不僅要符合醫(yī)院層面的數(shù)據(jù)管理規(guī)范,還要參考遵循國(guó)家、行業(yè)等層面的相關(guān)標(biāo)準(zhǔn)規(guī)范。但是值得提出的是,目前很多醫(yī)院重系統(tǒng)建設(shè),輕標(biāo)準(zhǔn)建設(shè)。信息系統(tǒng)的建設(shè)和運(yùn)維已經(jīng)讓醫(yī)院的信息部門(mén)不堪重負(fù),極少會(huì)開(kāi)展相應(yīng)數(shù)據(jù)標(biāo)準(zhǔn)的研究,也極少有醫(yī)院會(huì)成立相應(yīng)的數(shù)據(jù)管理部門(mén),專(zhuān)責(zé)于開(kāi)展數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)治理及數(shù)據(jù)利用。@spgoall 和祐國(guó)際醫(yī)院 信息管理部部長(zhǎng):答案是肯定的,臨床數(shù)據(jù)中心的數(shù)據(jù)也在醫(yī)院管理范疇內(nèi),必須遵從管理規(guī)范。
3、臨床大數(shù)據(jù)中心,怎樣將臨床醫(yī)生和護(hù)士的結(jié)構(gòu)化電子病歷數(shù)據(jù)直觀顯示在臨床科室?
【問(wèn)題描述】臨床數(shù)據(jù)中心的數(shù)據(jù)應(yīng)該是醫(yī)院最核心的數(shù)據(jù),怎樣從結(jié)構(gòu)化電子病歷中提取醫(yī)生和管理部門(mén)所需要的數(shù)據(jù),保障從數(shù)據(jù)到轉(zhuǎn)化,應(yīng)該是關(guān)鍵問(wèn)題。@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:目前,臨床數(shù)據(jù)中心的利用有很多方式,包括360患者全息視圖、臨床決策支持系統(tǒng)等,都可以基于數(shù)據(jù)中心中匯集的各業(yè)務(wù)系統(tǒng)(包括HIS、LIS、PACS等)的數(shù)據(jù),提供利用轉(zhuǎn)化。臨床數(shù)據(jù)中心的利用,取決于醫(yī)院醫(yī)生和管理部門(mén)數(shù)據(jù)需求的明晰化,這個(gè)是利用的目標(biāo),前提則是業(yè)務(wù)系統(tǒng)中有相關(guān)的數(shù)據(jù)源,而重點(diǎn)在于數(shù)據(jù)源提供的數(shù)據(jù)有較高的數(shù)據(jù)質(zhì)量。不然數(shù)據(jù)的轉(zhuǎn)化利用效果則會(huì)大打折扣。圍繞上面幾點(diǎn),臨床數(shù)據(jù)中心要扎實(shí)持續(xù)做好數(shù)據(jù)需求的分析,保障數(shù)據(jù)源的穩(wěn)定,形成規(guī)范的數(shù)據(jù)治理體系,為后續(xù)數(shù)據(jù)的利用提供基礎(chǔ)。
4、醫(yī)院各部門(mén)數(shù)據(jù)歸口不一致,如何解決?
@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:醫(yī)院部門(mén)間的數(shù)據(jù)歸口不一致是業(yè)務(wù)使然,是正常狀態(tài),如醫(yī)務(wù)部門(mén)的數(shù)據(jù)統(tǒng)計(jì)口徑和統(tǒng)計(jì)部門(mén)的數(shù)據(jù)統(tǒng)計(jì)口徑往往是不一樣的,如就診人次數(shù)的統(tǒng)計(jì),他們各自取的有可能是不同業(yè)務(wù)表的數(shù)據(jù),醫(yī)務(wù)部門(mén)可能統(tǒng)計(jì)掛號(hào)人次數(shù)作為就診人次數(shù),而統(tǒng)計(jì)部門(mén)統(tǒng)計(jì)的是醫(yī)生看診人次數(shù)作為就診人次數(shù)。面對(duì)這樣的問(wèn)題,個(gè)人理解應(yīng)該從如下方面解決:
(1)統(tǒng)一數(shù)據(jù)口徑。要梳理醫(yī)院現(xiàn)有各部門(mén)數(shù)據(jù)需求,充分分析研究各部門(mén)的數(shù)據(jù)需求所對(duì)應(yīng)的業(yè)務(wù)目標(biāo),充分溝通協(xié)商,形成有效的、統(tǒng)一規(guī)范的統(tǒng)計(jì)數(shù)據(jù)集;(2)統(tǒng)一數(shù)據(jù)來(lái)源。業(yè)務(wù)數(shù)據(jù)統(tǒng)一匯聚在數(shù)據(jù)中心中,所有數(shù)據(jù)需求應(yīng)從數(shù)據(jù)中心中獲取,從而避免從不同業(yè)務(wù)系統(tǒng)獲取數(shù)據(jù)導(dǎo)致的不一致情況。@陳建 武漢市中心醫(yī)院 系統(tǒng)運(yùn)維工程師: 這個(gè)問(wèn)題現(xiàn)在是絕大部分醫(yī)院面臨的問(wèn)題,我個(gè)人建議是劃分業(yè)務(wù)域,建立指標(biāo)庫(kù)。業(yè)務(wù)域:就診、計(jì)費(fèi),業(yè)務(wù)活動(dòng):門(mén)診就診、門(mén)診結(jié)算,原子指標(biāo):門(mén)診就診人次、門(mén)診計(jì)算金額,派生指標(biāo):月度門(mén)診就診人次、月度門(mén)診藥品結(jié)算金額,復(fù)合指標(biāo):月度門(mén)診藥品均次費(fèi)用。針對(duì)這個(gè)例子結(jié)合業(yè)務(wù)域?qū)⒃又笜?biāo)歸口科室:門(mén)辦和財(cái)務(wù)科,那么通過(guò)原子指標(biāo)衍生的派生指標(biāo)和復(fù)合指標(biāo)口徑就可以保持一致。需要注意的是:建立指標(biāo)庫(kù)的前提是要建立醫(yī)院的數(shù)據(jù)資產(chǎn),關(guān)鍵就是元數(shù)據(jù)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)血緣等。現(xiàn)在很多行業(yè)做大數(shù)據(jù)都會(huì)面臨這種問(wèn)題,各部門(mén)分屬不同的領(lǐng)域,所以在構(gòu)建大數(shù)據(jù)之前,首先我覺(jué)得要明確的就是項(xiàng)目的架構(gòu),信息化逐漸的已經(jīng)不再是企業(yè)的輔助系統(tǒng),而是逐漸成為決策系統(tǒng),要做大數(shù)據(jù),那么首先要做的就是把信息化做到一定的高度。底層的數(shù)據(jù)如病例,患者信息,醫(yī)院信息還有綜合的財(cái)務(wù)等信息要打通,這部分需要多個(gè)部門(mén)來(lái)配合,并且由獨(dú)立的信息化部門(mén)來(lái)牽頭完成的,梳理出數(shù)據(jù)的共性和特點(diǎn),然后建立公共的數(shù)據(jù)倉(cāng)庫(kù),再根據(jù)業(yè)務(wù)的特點(diǎn)梳理出哪些信息是需要進(jìn)行挖掘的。很多時(shí)候,大數(shù)據(jù)平臺(tái)的邏輯構(gòu)建要比物理建設(shè)更重要,要綜合現(xiàn)有的數(shù)據(jù)資源,共同分析才能形成更好的思路。
5、CDR、ODR、RDR三者的邊界怎么劃分?面向臨床醫(yī)療醫(yī)生的數(shù)據(jù)呈現(xiàn)方式是什么?
【問(wèn)題描述】臨床數(shù)據(jù)中心(CDR),運(yùn)營(yíng)數(shù)據(jù)中心(ODR)和科研數(shù)據(jù)中心(RDR),三者存在交集,那么他們的邊界怎么劃分?面向臨床醫(yī)療醫(yī)生的數(shù)據(jù)呈現(xiàn)方式是什么?@spgoall 和祐國(guó)際醫(yī)院 信息管理部部長(zhǎng):三大數(shù)據(jù)中心實(shí)際上就是三個(gè)業(yè)務(wù)主題,邊界取決于業(yè)務(wù)數(shù)據(jù)屬于哪個(gè)主題類(lèi)別,但由于業(yè)務(wù)數(shù)據(jù)也存在多個(gè)類(lèi)別,所以存在交集,特別是臨床和科研,數(shù)據(jù)交集比較多。面向醫(yī)療臨床醫(yī)生的數(shù)據(jù)呈現(xiàn)方式主要還是患者360視圖,也就是基于一個(gè)患者的全生命周期的診療數(shù)據(jù),如果數(shù)據(jù)能打通院外,那就可以以電子健康檔案的方式呈現(xiàn)。@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:CDR、ODR和RDR都是基于業(yè)務(wù)領(lǐng)域進(jìn)行的邏輯層面的數(shù)據(jù)劃分和再組織,而實(shí)際業(yè)務(wù)數(shù)據(jù)的產(chǎn)生也就是數(shù)據(jù)源是相同的,都是基于實(shí)際的業(yè)務(wù)系統(tǒng),如HIS、LIS、PACS、HRP等。這三類(lèi)數(shù)據(jù)中心的目標(biāo)都是為了其相應(yīng)領(lǐng)域的上層業(yè)務(wù)應(yīng)用的需求,在對(duì)實(shí)際業(yè)務(wù)數(shù)據(jù)多元化采集加工基礎(chǔ)上,進(jìn)行的主題化匯聚,進(jìn)而知識(shí)化應(yīng)用。三大數(shù)據(jù)中心基于的業(yè)務(wù)領(lǐng)域分別為臨床、管理和科研,雖然使用的數(shù)據(jù)源和維度可能有時(shí)相同,但是其基于此服務(wù)的應(yīng)用目標(biāo)是不一樣的。舉個(gè)例子,急診就診人員信息表,在CDR和ODR都可能有這部分?jǐn)?shù)據(jù),但是CDR中可能服務(wù)的上層應(yīng)用是為某個(gè)急診醫(yī)生查詢(xún)本人看診人員數(shù)量或者查詢(xún)剩余就診人數(shù),ODR中該部分?jǐn)?shù)據(jù)主要是為醫(yī)務(wù)管理人員查詢(xún)某天、某月乃至某年急診人次數(shù)抑或是通過(guò)可視化的方式展現(xiàn)急診就診人數(shù)的趨勢(shì)圖,或者結(jié)合時(shí)間、職業(yè)等進(jìn)行關(guān)聯(lián)分析得出相關(guān)的趨勢(shì)分析。所以我個(gè)人認(rèn)為三者的邊界是模糊的,要基于業(yè)務(wù)領(lǐng)域和場(chǎng)景具體情況具體分析。面向臨床醫(yī)療醫(yī)生的數(shù)據(jù)展現(xiàn)方式有十分多的類(lèi)型和方式,可視化、多維度,相關(guān)的技術(shù)和工具以及相關(guān)的人員及業(yè)務(wù)都是相對(duì)較為成熟和成體系的。重點(diǎn)不在于有哪些類(lèi)型和方式,重點(diǎn)在于展現(xiàn)的需求是否明確,展現(xiàn)的數(shù)據(jù)是否有來(lái)源,展現(xiàn)的數(shù)據(jù)質(zhì)量是否足夠高,這三個(gè)是對(duì)臨床醫(yī)療醫(yī)生的數(shù)據(jù)呈現(xiàn)問(wèn)題需要解決的三大問(wèn)題。四、基于大數(shù)據(jù)的存儲(chǔ)規(guī)劃角度1、如何處理數(shù)據(jù)的存儲(chǔ)問(wèn)題,尤其是影像數(shù)據(jù)?【問(wèn)題描述】建設(shè)科研大數(shù)據(jù)平臺(tái),一般都是將各個(gè)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)重新收集整理,結(jié)構(gòu)化的數(shù)據(jù)也還好,并不占用空間,而非結(jié)構(gòu)化的數(shù)據(jù)例如影像數(shù)據(jù),一個(gè)大型三甲醫(yī)院的增量是非常大的,如果這些數(shù)據(jù)都抽取到科研大數(shù)據(jù)平臺(tái)醫(yī)院相當(dāng)于又要重新建設(shè)存儲(chǔ),如何平衡這些非結(jié)構(gòu)化的數(shù)據(jù)的存儲(chǔ)?@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:對(duì)于這類(lèi)數(shù)據(jù),應(yīng)該要做好統(tǒng)籌規(guī)劃,醫(yī)院的數(shù)據(jù)都是會(huì)做容災(zāi)備份的,所以一般醫(yī)院存放同類(lèi)數(shù)據(jù)基本都是2份或2份以上,在業(yè)務(wù)系統(tǒng)、科研大數(shù)據(jù)平臺(tái)或者別的其他應(yīng)用系統(tǒng)對(duì)某個(gè)非結(jié)構(gòu)化數(shù)據(jù)有讀取或使用需求的時(shí)候,應(yīng)該充分利用容災(zāi)備份環(huán)境中的同類(lèi)數(shù)據(jù)。另外,在軟件設(shè)計(jì)和數(shù)據(jù)庫(kù)存放時(shí),該類(lèi)增量較大的非結(jié)構(gòu)化數(shù)據(jù)以地址指針的方式存放,如需要調(diào)用時(shí)再通過(guò)地址調(diào)轉(zhuǎn)到實(shí)際的數(shù)據(jù)存放路徑。這樣將極大的緩解該部分?jǐn)?shù)據(jù)的讀寫(xiě)壓力。
2、醫(yī)院大數(shù)據(jù)平臺(tái)、科研平臺(tái)等推薦什么存儲(chǔ)架構(gòu)?
【問(wèn)題描述】醫(yī)院大數(shù)據(jù)平臺(tái)、科研平臺(tái)等平臺(tái),推薦存儲(chǔ)架構(gòu)是?除了分布式架構(gòu)的分布式存儲(chǔ),能否做個(gè)分析,用哪種類(lèi)型的存儲(chǔ)適合非特大型三甲醫(yī)院呢?@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:醫(yī)院大數(shù)據(jù)平臺(tái)、科研平臺(tái)等平臺(tái),鑒于其數(shù)據(jù)的多模態(tài)、異構(gòu)化、海量化,建議存儲(chǔ)架構(gòu)也是混合多樣的,要針對(duì)數(shù)據(jù)類(lèi)型、業(yè)務(wù)需求、性能要求等綜合考慮,結(jié)合分析。即使是非特大型三甲醫(yī)院,其基本業(yè)務(wù)也是和三家醫(yī)院相差無(wú)幾的,只是同樣的系統(tǒng),體量不同而已。如果體量不大、增量不高,為了方便維護(hù),可以考慮超融合的架構(gòu)體系也可以考慮一體化存儲(chǔ)的方式,存儲(chǔ)中涵蓋了閃存等高速盤(pán),也有SAS、SATA等低速盤(pán),支持NFS、ISCSI等協(xié)議方式,但是值得提出的是這類(lèi)存儲(chǔ)雖然支持容量的擴(kuò)展,但是存儲(chǔ)機(jī)頭的緩存、性能等可能會(huì)成為后續(xù)擴(kuò)容、擴(kuò)展的瓶頸,所以要對(duì)這方面特別關(guān)注。避免后續(xù)成為性能瓶頸。
3、關(guān)系型數(shù)據(jù)庫(kù),非關(guān)系型數(shù)據(jù)庫(kù)還是分布式數(shù)據(jù)庫(kù),醫(yī)療大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)如何考慮?大型的數(shù)據(jù)整合平臺(tái)如何將異構(gòu)化數(shù)據(jù)統(tǒng)一整合,是使用傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)還是采用其他方案?
@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:要考慮數(shù)據(jù)類(lèi)型、業(yè)務(wù)場(chǎng)景、時(shí)效要求、性能要求等因素。因?yàn)閿?shù)據(jù)的多樣性必然導(dǎo)致基礎(chǔ)架構(gòu)的復(fù)雜性、差異性和多樣性。多種類(lèi)型的數(shù)據(jù)庫(kù)、存儲(chǔ)架構(gòu)并存應(yīng)該是醫(yī)療大數(shù)據(jù)平臺(tái)的常態(tài),鑒于底層架構(gòu)對(duì)數(shù)據(jù)及應(yīng)用上層的透明性特點(diǎn),結(jié)構(gòu)化關(guān)系型數(shù)據(jù)雖然也能存放在分布式或?qū)ο蟠鎯?chǔ)中,但是其性能必然大打折扣,不同的數(shù)據(jù)庫(kù)設(shè)計(jì)是,其適宜存儲(chǔ)和處理的數(shù)據(jù)對(duì)象是一定的,所以我們?cè)诳紤]醫(yī)療大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)是,要結(jié)合業(yè)務(wù)場(chǎng)景、數(shù)據(jù)類(lèi)型、以及各類(lèi)數(shù)據(jù)庫(kù)、存儲(chǔ)架構(gòu)的技術(shù)特點(diǎn)綜合去考慮。
4、如何解決存儲(chǔ)擴(kuò)容時(shí)不同廠商技術(shù)之間差異化問(wèn)題?
@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:可以通過(guò)云存儲(chǔ)的方式去解決。其中有兩種比較常見(jiàn)的方式:(1)網(wǎng)關(guān)的方式。如IBM的SVC,EMC的Vplex,通過(guò)存儲(chǔ)網(wǎng)關(guān)將不同廠家的存儲(chǔ)匯集起來(lái)再對(duì)外開(kāi)放;(2)外接存儲(chǔ)的方式。通過(guò)某一高性能的存儲(chǔ)其自帶的虛擬化套件,然后將其他存儲(chǔ)外接到其上面,相當(dāng)于外置硬盤(pán)一樣,統(tǒng)一由該高端存儲(chǔ)匯集后對(duì)外開(kāi)放。
5、對(duì)于醫(yī)院各種類(lèi)型的數(shù)據(jù),分別用什么方式、什么設(shè)備存儲(chǔ)最適合?
@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:不僅要根據(jù)數(shù)據(jù)類(lèi)型如結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化來(lái)區(qū)分存儲(chǔ)的選擇,而且還要根據(jù)數(shù)據(jù)的重要性、時(shí)效性、數(shù)據(jù)量大小、成本投入等來(lái)區(qū)分存儲(chǔ)的選擇。一般來(lái)說(shuō)重要的、時(shí)效性要求高的結(jié)構(gòu)化數(shù)據(jù),一般采用高端的全閃存儲(chǔ)或同類(lèi)級(jí)別的存儲(chǔ),并且配以雙活等高可用手段;重要性一般的非結(jié)構(gòu)化數(shù)據(jù)可以采用分布式存儲(chǔ)或者對(duì)象存儲(chǔ);重要性一般,共享需求較高的,則可以采用NFS類(lèi)型的存儲(chǔ)。當(dāng)然上述存儲(chǔ)選擇的建議也非絕對(duì)的,還是要根據(jù)具體的業(yè)務(wù)情況具體分析。
6、醫(yī)院大數(shù)據(jù)平臺(tái)數(shù)據(jù)是如何備份的?
【問(wèn)題描述】醫(yī)院大數(shù)據(jù)平臺(tái)數(shù)據(jù)是如何備份的?環(huán)境是非hadoop環(huán)境,是基于數(shù)據(jù)庫(kù)環(huán)境做的大數(shù)據(jù)平臺(tái),怎么備份呢?推薦規(guī)劃備份頻率是??@zyp8365 廣東省中醫(yī)院 高級(jí)工程師:備份方式建議分類(lèi)備份。針對(duì)大數(shù)據(jù)平臺(tái)的應(yīng)用部分,一般體量較小,建議是根據(jù)更新頻率進(jìn)行,每次更新后進(jìn)行全量備份。針對(duì)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)部分,因?yàn)槭菙?shù)據(jù)庫(kù),建議可以采用數(shù)據(jù)庫(kù)專(zhuān)有技術(shù)做實(shí)時(shí)容災(zāi),如oracle的dataguard,sqlserver的mirror等。除了實(shí)時(shí)容災(zāi)外,在數(shù)據(jù)庫(kù)建立后做一次全量備份,并且可以根據(jù)數(shù)據(jù)增長(zhǎng)情況及數(shù)據(jù)恢復(fù)時(shí)限要求做每周、每2周或每月一次的全量備份,中間時(shí)間輔以差異備份。