科学技术/NEWS CENTER

机器学习如何分析病人是否危险 USC教授刘燕告诉

发布时间:2017-12-29

  机器学习如何分析病人是危险刘教授USC告诉你

  中国科学技术网[编者按]由中国人工智能学会,阿里巴巴与蚂蚁金共同主办,CSDN中国科学院自动化研究所主办的第三届中国人工智能大会(CCAI 2017)将由中国人工智能学会7月22日 - 23日正式举行,会议第二天下午,刘燕女士将参加“人工智能科学与艺术论坛”,分享她对人工智能与艺术相结合的想法,语音识别到后来的人机交战之间,人工智能技术已经不再是天空的云彩,遥不可及,而是更多的登陆人生,解决很多具体问题。机器学习作为一种实现人工智能的方式智能化,运用机器学习训练模式被广泛应用于复杂系统的预测,股市涨跌,是否自然灾害等。这些通常是由exp所有的人都可以使用机器学习来实现更准确的预测。而这一切,都离不开数据分析。在CCAI大会前夕,CSDN采访了南加州大学计算机系终身教授,机器学习中心主任刘岩。她的主要研究项目是时间序列和时空序列数据的分析和研究。机器学习在医学中的应用和一些机器学习方法的分析被咨询。南加州大学计算机系终身教授,机器学习中心主任刘燕。她拥有卡耐基梅隆大学(Carnegie Mellon University)计算机科学硕士学位和计算机博士学位2006-2010 IBM Research研究员,主要研究项目是时间序列和时空序列数据的分析研究,组织研讨会,研究成果被广泛应用于交通预测,医疗,环境,智能生产等领域,曾获得国家科学基金奖,大川基金会研究奖,ACM论文奖(全球计算机博士论文奖),暹罗数据挖掘国际论文奖,雅虎,IBM,Facebook学院奖等,以下是采访实录:CSDN:首先请与您的读者分享您的关注技术领域和目前正在研究的方向刘艳:主要研究两个方面,一个是人工智能的基础研究,包括两个方向:可解释的机器学习和移民学习。机器学习的大多数方法都把算法看作黑盒子。非技术人员无法理解机器学习算法如何产生这样的结果。我们希望提供解释和准确的机器学习方法。移民学习是基础人工智能研究的一大领域。我们通常在一个封闭的环境中研究算法,并将这些算法应用到实际中。我们发现应用程序中数据的统计分布以及用来给机器学习数据的数据是不一样的,这涉及到重定位学习的问题。其次是关于人工智能的应用。我们主要用于医疗。医疗方面存在很多未解决的问题。我们希望通过分析医学大数据,我们可以得到一个机器学习模型,帮助医生解决实际问题。另一方面,智能交通和数字城市,利用大数据有效预测交通,环境和电网调度,将城市变成数字化城市,使城市变得更加智能化。机器学习在医学应用领域CSDN:您的时间,空间时间序列分析和研究成果的研究已经应用到交通预测,医疗,环境等领域,然后是医疗领域,时间序列和时空系列研究中解决的具体问题有哪些,实际应用中,预测准确度有多少?刘艳:医学研究中的时间序列或时空序列,我们做了四个方面:急诊室病人的预后。在收集患者体温,心率,血氧水平等患者时间序列的基础资料后,采用深度学习的方法预测急诊室患者的病情,如病人是否还需要呼吸机,24小时的生命是否危险,我们主要在急诊室做这些数据分析,看病人的健康状况,帮助医生做诊断和治疗。我们的研究能够在未来24小时内判断患者是否处于危险中的准确率达到80%-90%,与现有技术相比准确度提高了20%-30%。预测癌症患者生存时间。通过机器学习,我们主要使用深入的网络学习来分析以前患者的数据,并确定患者的生存时间。预测糖尿病患者的行为。长期病例如糖尿病,通过血糖测量仪器或可穿戴设备获取病人“日常行为”的时间序列数据,并通过分析分析病人的饮食和运动状况。镇痛剂量的判断。常用的止痛药会导致患者感到疼痛,如果给予太少的剂量,患者可能会上瘾,我们需要根据患者预测最合适的止痛剂剂量,并提供个性化的镇痛剂量研究。 CSDN:您曾经在医学领域的深度学习应用中提到了深度学习网络(DNN)+ GRU(门控循环单元)深度学习模型。如何将这两种模式结合起来刘艳:这主要是一系列关于深度学习方法处理医学数据的研究。医疗数据中有不同类型的数据,如急诊科收集的时间序列数据,患者年龄,体重,病史,医学图像等健康数据,如果您想使用患者的病史资料,想要在急诊室使用病人的时间序列信息,需要同时研究这两种数据,为我们提供更全面的病人健康信息。在这个模型中,我们使用DNN来处理患者以往的病史和一些实验数据,通过GRU处理这两个时间序列相当于在这个机器学习模型中放入不同类型的数据考虑,这将能够机器学习方法CSDN:时间序列分析是定量预测的方法之一,所以数据分析有多少数量级是值得考虑的?在数据量大的情况下,如何选择合适的模型?这个过程有哪些困难?刘妍:根据情况,可能会有很大的不同,因为在时间序列中,一个非常重要的问题是数据会发生变化,数据的统计分布会发生变化随着时间的推移,如果它的变化很小,或者基本相同,可能有数以万计的数据点使机器学习模型学习得很好,如果数据的统计概率随时间变化,作为金融股的预测,其概率分布变化非常快,这是一个非常困难的预测,很难说需要多少数据。在数据量大的情况下,以前的统计方法主要是ARIMA(自回归整合移动平均模型),ARIMA是统计学中使用最广泛的时间序列预测模型。现在,我们都知道深度学习,我们认为深度学习是机器学习现在可用于时间序列的方式。在时间序列的收集和分析中,您可能会遇到一些难以解决的问题:不完整的数据收集。例如在急诊室,如果有机械报警,护士会将病人的传感器从病人身上取下,此时病人的数据将不会被收集;又如,在交通中,一定的驾驶时间过程中,司机的手机信号不好,那么在这个过程中,并不是收集在哪个路径上的司机拿的信息,所以我们收集到的数据,不是一个完整的订单。在这一点上,我们需要一些好的算法来弥补这些不可见的数据,这样我们可以做出更好的预测。时间数据以不同的频率收集。例如,在城市中,数据由不同的传感器收集,温度数据可能每分钟收集一次,但是网格使用量只能每十分钟收集一次。这种多频率时间序列分析现在已经有了一些方法尚未得到很好的解决,这也是一个存在的问题;数据迁移。在时间数据分析中,数据迁移是非常普遍的,但是现有的模型不能很好地完成。 CSDN:格兰杰因果检验是研究两个变量之间是否存在因果关系的常用方法。我注意到你的研究领域之一是一个时间因果模型。基于Granger因果关系模型的创新是什么?刘艳:格兰杰因果关系模型是我们过去五年主要研究的课题。我们提出了Granger图模型,主要做了两个创新。速度,减少算法的复杂性。以前的Granger因果关系需要检测,其算法复杂度为N(N是时间序列数),并且在我们的创新之后线性地减少了时间复杂度。统计上,减少数据的复杂性。以前,N个时间序列需要大量的数据来检测Granger因果关系,我们的一个理论表明,我们的方法可以减少数据的复杂性,使得只有很小的一部分数据可以被顺序求解。这些创新主要应用于分析全球变暖的原因,监管网络和社会网络。 CSDN:在机器学习中,通常有很多模型可供选择,在建立模型时,需要使用一些历史数据来帮助机器学习算法学习一组数字特征与预测输出之间的关系。但即使模型能够准确预测历史数据,如何知道该模型对新数据是否有效呢?刘焱:在现有数据的情况下,我们可以用检测的方法,利用现有的数据来预测未来发生的情况,会有一个估值,往往会比较乐观。在实践中,会出现数据迁移问题,如何判断模型对新数据是否有效,大致分为以下两点:预测后,与实际观察结果进行比较,看它们是否不相同;看是否存在一个统计的迁移概率,如果我们可以看到一个迁移的变化点,我们可以找到数据变化的统计概率。但总的来说,并不是一个很好的解决办法,因为可能会有违规行为。数据的概率可能不会改变,但观察到的点与之前不一样。在这些情况下难以预测,难以判断是不规则点还是移民概率。目前对这个问题目前还没有特别好的解决方案,但是现在的一些更基础的解决方案已经在很多应用中得到了广泛的应用,这也是未来研究的一个课题。 CSDN:时间序列和时空序列分析方法本质上有什么不同?刘艳:时间序列,相对来说,是一维数据,只考虑一个方面,是时间方向。空间序列,这是相对而言要考虑多维数字的顺序。时间是一个一维的序列,空间相当于两个序列,三者之间建立一个三维序列。从一维到三维,复杂性呈指数级增长。因此,从时间序列到时空序列,其算法复杂度和运算复杂度都是指数增长问题。 CSDN:对于那些想进入机器学习领域的人,他们有什么技巧?刘焱:在深度学习方面,从开发者的角度来看,有几个方面。对于那些想要改进自己的深度学习算法的开发者,他们需要统计学和数学知识的强大支持,包括离散数学,数学理论等。同时,我认为还需要编程,从算法到真正的发展,有很多考虑因素,如统计学,数学背景,程序设计等等。如果开发人员想用深度学习的模式来解决实际问题,现在已经有很多开源软件已经形成了一个非常好的平台。通过现有的开源软件对上述开源软件进行了一些改进。在许多情况下,统计或数学研究可能不是特别必要的。一般来说,这取决于开发人员从哪些方面入手,从深入的学习,基础研究到切入,还是要切入应用,所需要的技能是不一样的。关于CCAI 2017 CSDN:在这次会议上,您将与其他6位女性专家一起参与人工智能科学与艺术论坛的讨论。人工智能与艺术的结合有何独到见解?刘妍:我可以分享一下我想分享的一些观点,目前每个人在人工智能方面都取得了比较令人鼓舞的成绩,但是我觉得还有很多方面还没有完善,下一步还有很多问题需要研究,一方面是可解释的人工智能模型,比如人脑没有办法解释我们如何创造艺术,或者是它的灵感和启发到底是什么?机器不是一个好的解释,如果通过人工智能,通过可解释的人工智能来学习,我们可以帮助人类解释灵感是什么,最好是帮助人们发展他们的灵感和创造更好的艺术;另一方面,我认为这是人工智能的普遍化,人工智能的艺术现在主要用来模仿人类,比如机器可以创造出类似莫扎特的音乐。然而,它并没有达到崛起,并创造了一些不同于前一个的创造性艺术。由于机器学习或通过大规模的数据学习,来模仿现有的艺术。如果这种概括能够做得好,就会让机器创造出一些没有创造出来的东西,这可能会激发人的创造性思维。从这些角度来看,这也是一个比较困难的研究问题,但我认为这也是未来人工智能和艺术发展之路上必须解决的问题。 CSDN:你对CCAI会议感兴趣的是什么?刘焱:在这次会议上,我看到有很多不同的探讨和讨论的方面。有些可能更符合我们的研究方向:一方面是基于人工智能的研究,如移民学习,可伸缩性的基础研究。另一方面,人工智能应用,如医疗,智能交通和金融研究的人工智能,都是我的兴趣所在。

海洋之神hy.cc快速充值中心

2017-12-29

更多内容,敬请关注:

海洋之神hy.cc快速充值中心官网:/

海洋之神hy.cc快速充值中心新浪官方微博:@海洋之神hy.cc快速充值中心

海洋之神hy.cc快速充值中心发布微信号: