生物医学大数据处理的云计算解决方案

摘要:随着二代测序、质谱分析、医学影像等生物医学技术的发展和应用,生物医学数据呈现爆炸性增长趋势,其处理面临数据量大、计算强度大、维度高等问题。云计算在资源分配、数据存储、计算、共享等方面具有优势,能够帮助解决生物医学大数据处理的相关问题。深入分析了云计算在生物医学大数据处理方面的特点,归纳总结了常见的生物云计算解决方案,对生物云计算的发展和挑战进行了展望。有望建立能够整合多源生物医学数据的新型计算方法,以解决复杂的生物医学问题。
关键词:生物医学技术;二代测序;医学影像;大数据;云计算
1引言
近二十年来生命科学研究在生物医学技术的推动下得到了快速发展。特别是高通量测序技术(或称为二代测序、下一代测序)凭借其优良的测序性能和低廉价格(每5个月价格降一半[1])在领域内得到了广泛应用。二代测序同时衍生出了RNA-seq[2]、ex-ome-seq[3]、ChIP-seq[4]、DNA甲基化测序[5]、染色质交互分析[6]等针对特定生物分子或靶标的测序方法。另外,蛋白质质谱分析法被用于蛋白质组学研究[7],医学影像(如CT、核磁共振MRI)已成为医学研究及诊断的常用技术。在新型生物技术的协助下,大型生物/医学项目(如1000基因组[8]、ENCODE[9]、modEN-CODE[10]、CancerGenomeAtlas[11]、Humanmicrobi-ome[12]等)得以完成或正在稳步推进。然而,在利用相关技术进行研究的同时也产生了规模庞大的数据,其累积速度已超过了摩尔定律(Moore’sLaw)所标量的计算机发展速度,形成了“生物医学大数据”(bio-medicalbigdata)[1]。当前,生物医学大数据处理的相关问题已成为生命科学研究发展的重要挑战。
更新了一篇医学相关的论文,如医学中文核心期刊好投推荐,您可以点击并前往查看。
2生物医学大数据处理与云计算
由于生物医学研究问题的复杂性,对生物医学大数据的处理需要借助可靠的算法和高效的计算平台,而云计算恰能为生物医学大数据处理提供有力的平台支撑。
3生物云解决方案
3.1常见的生物云解决方案
当前常见的生物云解决方案如表1所示,主要涉及以下几方面如图1所示。
3.2生物云所涉及的云计算服务模
型商业化云计算主要向用户提供软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)这3种基本的云计算服务模型。同样地,商业化生物云在向生物云用户提供生物医学数据处理/软件开发的服务过程中也涉及这3种服务模型。
4生物云面临的挑战
尽管生物云已在领域内得到应用,但其在资源整合和有效利用方面仍然面临挑战。
4.1建立一致的生物云平台接口
现有的生物云主要包括商业化生物云、私有生物云及学术生物云这3种类别。其中每种生物云各有不同的机构予以实现,并面向各自的用户群。在数据存储方面,生物云之间存在着大量的冗余,且交互性不够好,这使得生物云的资源利用率达不到最优。因此,需要建立一致的生物云平台接口,以实现不同生物云之间的互联互访,使得生物云之间的资源能够充分共享,进而有助于生物医学大数据的处理。
4.2生物云的数据挖掘
生物云中存储了来源多样的生物医学数据,这些数据能够帮助科学家揭示丰富的生命奥秘。当前的挑战即在于如何进行生物数据挖掘,即筛选出合适的数据、建立模型,进而通过高效的计算方法获得生物医学信息。
5结论
与展望新一代生物医学技术的广泛应用使生物医学数据呈现爆炸性增长的趋势,生物医学研究由此进入大数据时代。相对于传统的生物医学数据处理环境,生物云在数据存储、计算处理、共享等方面具有优势,已经开始为生物医学大数据处理提供相关的解决方案,涉及序列比对、基因组装配及差异表达分析等生物信息处理的各个方面。未来有望建立能够整合多源生物医学数据的新型计算方法,以解决复杂的生物医学问题。
参考文献
[1]STEINLD.Thecaseforcloudcomputingingenomeinformatics[J].GenomeBiol,2010,11(5):207.
[2]MARIONIJC,MASONCE,MANESM,etal.RNA-seq:anassessmentoftechnicalreproducibilityandcomparisonwithgeneexpressionarrays[J].Ge-nomeresearch,2008,18(9):1509-1517.
[3]NGSB,BUCKINGHAMKJ,LEEC,etal.Exomesequencingidentifiesthecauseofamendeliandisorder[J].NatureGenetics,2009,42(1):30-35.
[4]JOHNSONDS,MORTAZAVIA,MYERSRM,etal.Genome-widemappingofinvivoprotein-DNAin-teractions[J].Science,2007,316(5830):1497-1502.
孙磊胡学龙张晓斌李云
《生物医学大数据处理的云计算解决方案》
- 花卉园艺论文盆栽花卉养
- 科技改革论文简析邓小平
- 新闻论文发表媒介终端化
- 内蒙煤炭论文发表分析煤
- 电气自动化技术新发展运
- 中国外语教学期刊征稿目
- 液压与气动杂志2016年目录
- 中级科技职称论文范文:
最新优质论文
- 中国民族博览是艺术类核
- 最新!锡林郭勒盟在全区
- 两三千字论文能发核心吗
- cpci是什么领域论文数据库
- 写车床维修论文参考哪些
- 施工技术期刊发论文要求
- 如何让sci杂志延长修稿时
- 评价期刊质量的指标
论文发表问题热点
- 吉林职称发一篇论文多少
- 医学论文准备格式基本要
- 医学学术杂志的常见鉴别
- 景观设计行业的职称论文
- 金属成型方面评职称用论
- 包装设计类期刊哪些收录
- 电气方面的职称都有哪些
- 发表论文有哪些不错的平