GraduationDesign

Picasun ECNU_Jinggg

任务书

  • 课题来源、意义与主要内容
    • 该课题来源为自拟。
    • 材料科学是研究材料的化学组成、晶体结构、显微组织、使用性能四者之间关系的一门科学。探讨其化学组成与力学性能之间的关系是材料科学中重要的基础性研究工作。在材料化学组成、晶体结构与性能三者的关系中 , 晶体结构上承组成 ,下启性能,将各因素结合成一个物性整体,因此自然而然晶体结构就成为了研究重点。
    • 机器学习是现今计算机科学研究中热门研究领域,其广泛应用于商品销售、个性推荐、人工智能等重要领域。由此出发而兴起的数据挖掘则是一门更加具象化的应用方向,它主要是使用一系列机器学习方法和统计学方法来提取、挖掘海量数据中的有效信息,为其他科学研究领域提供了非常强大的技术支撑。
    • 传统的材料晶体结构研究往往是正向工程,即从实验出发进行测量、计算得到材料的晶体结构参数,一般成本较高、效率较低。在一定的材料领域知识基础上,结合机器学习这种当前流行的数据挖掘技术不仅能够有效提高预测晶体结构的效率,还能降低实验代价从而提高科学研究效率,甚至为尚未发现的材料晶体结构提供重要的预测指导。
    • 而本课题会基于Ti-Nb 钛合金的四个与宏观力学性能相关的结构特征变量(宏观自由度):MNb(matrix)铌钛阵列(基质)的铌浓度、FNb(nanofilers)纳米填料的铌浓度、VF(volume fraction of nanofifillers)纳米填料的体积分数、NF( the number of nanofifillers)纳米填料的数量,来对其组成材料的力学性能:EI 初始杨氏模量(固体材料抵抗形变能力的物理量)、σL 表观弹性应力极限(由 “向后凸分裂法”得到的应力-应变曲线上的表观弹性阶段的临界点)、AH 迟滞面积(描述材料在受力过程中产生的能量损耗)进行表达式与关联分析,并通过相应资料查阅来完善其可解释性,具有很强的现实意义。
    • 研究内容:
      • 1、对现有包含材料组成、属性的材料数据集进行清洗、筛选和分类
      • 2、利用特征工程算法构造组成-属性的候选表达式,分析井筛选合适的表达式
      • 3、利用机器学习回归算法获取影响材料属性的关键因子,井与现有算法进行比较、讨论。
  • 目的要求和主要技术指标
    • 目的要求:
      • 1、对包含材料组成、属性的材料败据集进行数据数据清洗
      • 2、利用特征工程、机器学习回归算法等构造组成-属性的候选表达式
      • 3、分析井筛选合适的表达式,获取影响材料属性的关键因子。
    • 主要技术指标:
      • 1、对特征工程、机器学习回归算法的学习;
      • 2、尝试给出能够描述材料组成-属性关系的候选表达式;
      • 3、采取机器学习的集成策略进一步分析、改进表达式;
      • 4、提供多种机器学习方法的性能比较结果,针对表达式的可解释性进行分析和优化。
  • 进度计划
    • 第1-2周:收集并阅读有关文献,完成开题报告和任务书,配置好必要的计算机环境。
    • 第3-4周:完成材料数据的数据预处理阶段
    • 第5-6周:构建机器学习模型
    • 第7-8周:优化机器学习模型(中期检查)
    • 第9-10周:撰写论文第一稿
    • 第10-11周:论文第一稿交由指导老师审阅,并进行修改
    • 第12周:撰写论文第二稿交由指导老师审阅,并进行修改
    • 第13-14周:程序验收,完成论文
    • 第14-15周:论文答辩,上交毕业设计成绩及论文。
    • 其中,4月17-21日中期检查。
  • 主要文献、资料和参考书
    • [1] 周志华.机器学习[M]清华大学出版社.2016年1月第1版:13-18
    • [2] 胡国林,姚草根,孙彦波等.新型低密度Nb-Ti合金组织及性能研究[J].航天制造技术,2022,No.232(02):50-53.
    • [3] 张瑞琦,刘志伟,孙傲等.高速列车转向架构架用Nb-Ti微合金化钢板的研制[J].特殊钢,2020,41(01):32-35.
    • [4] Zhu, Y., Xu, T., Wei, Q. et al. Linear-superelastic Ti-Nb nanocomposite alloys with ultralow modulus via high-throughput phase-field design and machine learning. npj Comput Mater 7, 205 (2021).
    • [5] Dai D, Liu Q, Hu R, et al. Method construction of structure-property relationships from data by machine learning assisted mining for materials design applications[J]. Materials & Design, 2020, 196: 109194.
    • [6] Zhang Y, Liu H, Jin Z. Thermodynamic assessment of the Nb-Ti system[J]. Calphad, 2001, 25(2): 305-317.

开题报告

  • 课题背景及意义
    • 材料科学是研究材料的化学组成、晶体结构、显微组织、使用性能四者之间关系的一门科学。探讨其化学组成与力学性能之间的关系是材料科学中重要的基础性研究工作。在材料化学组成、晶体结构与性能三者的关系中 , 晶体结构上承组成 ,下启性能,将各因素结合成一个物性整体,因此自然而然晶体结构就成为了研究重点。
    • 机器学习是现今计算机科学研究中热门研究领域,其广泛应用于商品销售、个性推荐、人工智能等重要领域。由此出发而兴起的数据挖掘则是一门更加具象化的应用方向,它主要是使用一系列机器学习方法和统计学方法来提取、挖掘海量数据中的有效信息,为其他科学研究领域提供了非常强大的技术支撑。
    • 传统的材料晶体结构研究往往是正向工程,即从实验出发进行测量、计算得到材料的晶体结构参数,一般成本较高、效率较低。在一定的材料领域知识基础上,结合机器学习这种当前流行的数据挖掘技术不仅能够有效提高预测晶体结构的效率,还能降低实验代价从而提高科学研究效率,甚至为尚未发现的材料晶体结构提供重要的预测指导。
    • 本课题会基于Ti-Nb 钛合金的四个与宏观力学性能相关的结构特征变量(宏观自由度):MNb(matrix)铌钛阵列(基质)的铌浓度、FNb(nanofilers)纳米填料的铌浓度、VF(volume fraction of nanofifillers)纳米填料的体积分数、NF( the number of nanofifillers)纳米填料的数量,来对其组成材料的力学性能:EI 初始杨氏模量(固体材料抵抗形变能力的物理量)、σL 表观弹性应力极限(由 “向后凸分裂法”得到的应力-应变曲线上的表观弹性阶段的临界点)、AH 迟滞面积进行表达式与关联分析,并通过相应资料查阅来完善其可解释性,具有很强的现实意义。
  • 课题研究现状及发展趋势
    • “很多时候,人类科技发展的脚步,往往囿于材料的性能”。这句话的意思是,材料领域的不断发现在加快人类科技发展的同时,也会因为已知材料性能的局限而放缓发展的脚步。近年来,“材料基因组工程”已越来越成为材料科学研究的一大热门思路,这种思路也为材料科学研究者提供了一种从材料性能出发到材料本身组成的“逆向工程”研究的可能。
    • 机器学习是人工智能研究发展到一定阶段的必然产物。事实上,机器学习在二十世纪八十年代正是被视为“解决知识工程瓶颈问题的关键”而走上人工智能主舞台的。而今天,机器学习显然已发展成为一个广阔的学科领域。在计算机科学的诸多分支学科领域中,无论是多媒体、图形学,还是网络通信、软件工程,乃至体系结构、芯片分析,都能找到机器学习的身影。尤其是在计算机视觉、自然语言处理等领域,机器学习已成为最重要的技术进步源泉之一。当然,机器学习也为生命科学研究、大气污染治理、材料发现等交叉学科提供了重要的技术支撑。
    • 如今,国内外研究学者正积极探索使用机器学习方法与材料科学研究结合,尝试进行材料性能预测、新材料设计与发现等研究。这一交叉结合已在“材料基因组”计划中得到了有了的支持,所以这一方向也会有更多的计算机和材料科学研究人员加入到队伍中。
    • 材料力学性能的变化往往受到多个因素的影响,又要获得描述材料组成-属性关系的候选表达式,因此,要进行多元回归分析,我们把包括两个或两个以上自变量的回归称为多元线性回归。
      多元线性回归的基本原理和基本计算过程与一元线性回归相同,但由于自变量个数多,计算相当麻烦,一般在实际中应用时都要借助统计软件。
    • 但由于各个自变量的单位可能不一样,多因素都会影响到力学性能,而这些影响因素(自变量)的单位显然是不同的,因此自变量前系数的大小并不能说明该因素的重要程度,更简单地来说,同样铌浓度,如果用元为单位就比用百元为单位所得的回归系数要小,但是铌浓度对力学性能的影响程度并没有变,所以得想办法将各个自变量化到统一的单位上来。前面学到的标准分就有这个功能,具体到这里来说,就是将所有变量包括因变量都先转化为标准分,再进行线性回归,此时得到的回归系数就能反映对应自变量的重要程度。
    • 自然出版集团在柔性电子及其相关领域推出的首个“自然合作期刊”(Nature Partner Journal, NPJ),其中2021年的论文《Linear-superelastic Ti-Nb nanocomposite alloys with ultralow modulus via high-throughput phase-field design and machine learning》中,说明了具有特定财产的形状记忆合金(SMA)的优化设计对于先进技术的创新应用至关重要。在此,受最近提出的浓度调制设计概念的启发,我们结合高通量相场模拟和机器学习(ML)方法,探索了Ti-Nb纳米复合材料中的马氏体相变(MT)并设计了其力学财产。系统相场模拟生成了由四个宏观自由度构建的各种纳米复合材料的力学性能数据。采用ML辅助策略,对机械财产进行多目标优化,通过该策略,为下一组相场模拟预筛选出有希望的纳米复合结构。ML引导的模拟发现了一种优化的纳米复合材料,由富含铌的基质阵列(Nb-richmatrix)和缺乏铌(Nb-lean)的纳米填料组成,该复合材料具有机械财产的组合,包括超低模量、线性超塑性和在加载-卸载循环中无近滞后性。纳米复合材料的优异力学财产源自优化的连续马氏体相变,而非典型形状记忆合金中常见的尖峰一阶转变。这项工作证明了机器学习引导相场模拟在设计具有特殊性质的先进材料方面的巨大潜力。
  • 研究内容及研究目标
    • 本课题会基于Ti-Nb 钛合金的四个与宏观力学性能相关的结构特征变量(宏观自由度):MNb(matrix)铌钛阵列(基质)的铌浓度、FNb(nanofilers)纳米填料的铌浓度、VF(volume fraction of nanofifillers)纳米填料的体积分数、NF( the number of nanofifillers)纳米填料的数量,来对其组成材料的力学性能:EI 初始杨氏模量(固体材料抵抗形变能力的物理量)、σL 表观弹性应力极限(由 “向后凸分裂法”得到的应力-应变曲线上的表观弹性阶段的临界点)、AH 迟滞面积进行表达式与关联分析,并通过相应资料查阅来完善其可解释性,具有很强的现实意义。

    • 研究内容:

      • 1、对现有包含材料组成、属性的材料数据集进行清洗、筛选和分类;
      • 2、利用特征工程算法构造组成-属性的候选表达式,分析井筛选合适的表达式;
      • 3、利用机器学习回归算法获取影响材料属性的关键因子,井与现有算法进行比较、讨论。
    • 主要技术指标:

      • 1、对特征工程、机器学习回归算法的学习;
      • 2、尝试给出能够描述材料组成-属性关系的候选表达式;
      • 3、采取机器学习的集成策略进一步分析、改进表达式;
      • 4、提供多种机器学习方法的性能比较结果,针对表达式的可解释性进行分析和优化。
  • 预计的研究难点
    • 1、材料数据预处理。材料数据一般维度较大,维度之间的相关性比较复杂,需要通过算法对其进行合理的筛选。
    • 2、分类预测结果的精度优化。材料数据的数据集较小,一般只有几百条,有效的材料数据可能更少。这点对于机器学习模型训练的结果来说往往存在泛化能力不强、精度不高的缺点,所以需要通过一定的统计学数据抽样方法和机器学习算法集成来提升分类预测模型的泛化能力和精度。最大化结果的精度值。
    • 3、材料晶体结构物理属性的相关性预测。相关性预测是通过机器学习模型来反映物理性质本身的联系,需要有一定的材料科学领域基础知识来作为先验知识,继而用来辅助机器学习模型来作出更加准确的相关性预测。
  • 创新点
    • 1、从选题上,本课题面向材料数据,利用机器学习方法探索材料各个属性和性能间的内在关系,并完成“组成-属性”的候选表达式的筛选,具有跨学科交叉的特点,具有选题的创新性。
    • 2、采用多种机器学习方法做Nb-Ti合金物理性能预测分析,并进行结果可视化,对结果数据精度进行对比横向,再在纵向上采用集成算法优化模型获取最佳预测效果和分析,具有理论和方法的创新性。
  • 进度计划
    • 第1-2周:收集并阅读有关文献,完成开题报告和任务书,配置好必要的计算机环境。
    • 第3-4周:完成材料数据的数据预处理阶段
    • 第5-6周:构建机器学习模型
    • 第7-8周:优化机器学习模型(中期检查)
    • 第9-10周:撰写论文第一稿
    • 第10-11周:论文第一稿交由指导老师审阅,并进行修改
    • 第12周:撰写论文第二稿交由指导老师审阅,并进行修改
    • 第13-14周:程序验收,完成论文
    • 第14-15周:论文答辩,上交毕业设计成绩及论文。
    • 其中,4月17-21日中期检查。
  • 资料来源
    • [1] 周志华.机器学习[M]清华大学出版社.2016年1月第1版:13-18
    • [2] 胡国林,姚草根,孙彦波等.新型低密度Nb-Ti合金组织及性能研究[J].航天制造技术,2022,No.232(02):50-53.
    • [3] 张瑞琦,刘志伟,孙傲等.高速列车转向架构架用Nb-Ti微合金化钢板的研制[J].特殊钢,2020,41(01):32-35.
    • [4] Zhu, Y., Xu, T., Wei, Q. et al. Linear-superelastic Ti-Nb nanocomposite alloys with ultralow modulus via high-throughput phase-field design and machine learning. npj Comput Mater 7, 205 (2021).
    • [5] Dai D, Liu Q, Hu R, et al. Method construction of structure-property relationships from data by machine learning assisted mining for materials design applications[J]. Materials & Design, 2020, 196: 109194.
    • [6] Zhang Y, Liu H, Jin Z. Thermodynamic assessment of the Nb-Ti system[J]. Calphad, 2001, 25(2): 305-317.

中期报告

  • 毕业论文(设计)主要任务(不多于500字)

    • 论文《Linear-superelastic Ti-Nb nanocomposite alloys with ultralow modulus via high-throughput phase-field design and machine learning》中制备和测试样品的四维数据分别为MNb(matrix)铌钛阵列(基质)的铌(Nb)浓度 {15,16,17,18,19,20}、FNb(nanofilers)纳米填料的铌(Nb)浓度 {4,16,64}、VF(volume fraction of nanofifillers)纳米填料的体积分数 {1.562,6.25,14.062,25,39.062}和NF( the number of nanofifillers)纳米填料的数量 {5,6,7,8,9,10}。文中求得的三个力学性能指标:初始杨氏模量(EI),表示单位应力下材料产生的单位应变,其值代表抗形变能力;弹性应力极限 (σL),即材料开始出现非线性应变行为的应力阈值;迟滞面积(AH),描述材料在受力过程中产生的能量损耗。从四维数据中提取重要的特征来分别构造三个与目标力学性能指标的表达式。
    • 将表达式所得到的结果与决策树等适合材料科学机器学习相关方法得出的结果进行比较,验证表达式的准确性。
    • 通过文献的查阅来解释所得到的表达式,强调表达式的可解释性
    • 设计一种指标来衡量一批材料数据是否可以直接进行多元线性回归,作为本毕业设计的创新点
  • 简述开题以来所做的具体工作和取得的进展或成果(不少于1000字)

    • 论文的阅读
      • 论文《Linear-superelastic Ti-Nb nanocomposite alloys with ultralow modulus via high-throughput phase-field design and machine learning》作为本实验的数据来源,其核心内容是通过高通量相场设计和机器学习方法设计并制备出一种新型的钛-铌纳米复合超弹性合金,其具有极低的弹性模量和线性超弹性特性,表现出优异的弹性可逆性和抗疲劳性能,具有潜在的医疗和工程应用。该研究利用高通量相场方法预测出钛-铌合金的组织结构和性质,然后利用机器学习算法在预测结果中寻找具有优异性能的样本。最终,通过制备和测试这些样品,得到了一种具有优异性能的纳米复合材料。这种合金不仅具有极低的弹性模量和线性超弹性特性,而且具有高强度、高塑性和优异的耐疲劳性能。该论文的研究结果为新型纳米复合超弹性合金的设计和制备提供了一种新思路,同时为合金材料在医疗和工程领域的应用开辟了新的可能性。这篇论文同时抛出了一个预测问题,在已有的制备和测试样品数据中,如果能建立起四个变元(VF、NF、MNB、FNB)与三个目标量(EI、SL、AH)的表达式并通过理论性的解释来说明表达式的意义,能很大程度上预测出材料实验中得到的结果,为未来制造具有优异性能的铌钛合金材料提供方便。
    • 数据特征的提取
      • 难点与解决方案:
        • 分段问题:材料数据常常会有临界点的问题,比如超过某临界点,原本随着自变量线性变换的应变量会呈现非线性变换或不变换的问题。而解决分段问题,可以从二维折线图的拐点可发现潜在的常值或直接的线性关系,从而对数据进行合理的分段。
        • 变量数量问题:可能存在并不相关的变量,从而导致工作量上升,筛选变元非常困难。因此大量的实验,对数据的熟悉程度会很大程度上决定最后拟合出的表达式的精准性。可以先从结果与文献为导向,找到一定会影响到结果的变元,从而可以简化问题。如本来有四维数据,但文献已经告诉我们其中某一个数据一定会对最后的结果产生正/负的影响,所以可以在剩下的三维数据中再进行提取。从全组合情况提取特征来看,确定下一个必须的变元会大大的接下来的筛选以及回归工作量。
        • 特征非线性变化:不一定非线性变化后的特征后具有可解释性,如可能四个变元中前两个的乘积构成的新的特征与剩下两个变元直接进行回归能得到很好的实验结果,但文献中明确说明了这两个变量本就有一定的线性关系或互斥关系,那么作出的结果明显是不符合常理的。因此要从结果出发来导向问题,尽早确定必须的变元和互斥的变元,防止结果的不可解释性。
        • 多元线性回归的正态性:其中部分元素并不是正态分布的,存在独立非正态分布,整体可能也非正态分布问题。但作为材料数据,很多时候变元不会再一个区间内变动,而是在一个有限集合内变动,本就无法控制其正态性的问题,而又要得出表达式,因此多元线性回归是最适合的方式。
    • 机器学习
      • Sisso算法是指”simple set selection algorithm”,是一种用于材料科学中高通量计算的算法。它是一种基于机器学习的算法,可以自动地从一组材料结构中选择出最优的候选结构。Sisso算法的核心思想是通过分析材料的物理性质和结构特征,利用机器学习算法构建一个模型来预测材料的性能。它使用一组原始的候选结构,通过选择和构造新的结构,来优化材料的性能。在这个过程中,Sisso算法将使用一系列的特征描述器来提取结构特征,并将这些特征输入到机器学习算法中,以建立材料性能和结构特征之间的映射关系。Sisso算法的优点在于它可以显著提高高通量计算的效率,并且可以减少计算成本。因此,它在材料科学中具有广泛的应用前景,可以用于预测材料的各种性能,如电子结构、光电性能、力学性能等。通过Sisso算法对本实验数据进行处理得到的结果能直接得到一个线性表达式,但其结果并不存在分段的问题,无法解决材料学中临界点导致的非线性变换的问题,因此如果能对数据进行优质的分段后再通过Sisso算法进行处理,便会得到更好的数据结果。
      • 决策树实验,数据处理方便:决策树对于缺失值、异常值等问题的处理较为宽容,不需要对数据进行过多的预处理,因此适用于各种类型的数据。鲁棒性强:决策树算法能够自动处理高维度、非线性、非参数和混杂型数据,对于一些较为复杂的材料性能预测问题具有较好的鲁棒性。可扩展性强:决策树可以通过剪枝等方式进行优化,同时也可以通过集成学习的方式来提高模型的准确性和鲁棒性。但可解释性不强,
      • 多元线性回归实验,通过可视化能很早的对数据进行分段分类,得到鲁棒性比较高的表达式,但需要很大的计算成本,相较于Sisso会有更大的工作量,而不是直接把数据放入算法中得到结果。
    • 关于已得到的表达式
      • 已经得到了四个变元(VF、NF、MNB、FNB)关于杨氏模量(EI)的表达式与合理的解释,对于关于弹性应力极限(SL)和迟滞面积(AH)的表达式还存在分段可能不够清晰与解释性的问题所在,因此需要再进行更多的实验,选取解释性最强的表达式。
  • 存在的主要问题及解决办法

    • 主要问题:
      • 1、分段问题:分段点从二维折线图的拐点可发现潜在的常值或直接的线性关系
      • 2、变量数量问题:可能存在并不相关的变量,从而导致工作量上升,筛选变元非常困难
      • 3、特征非线性变化:不一定非线性变化后的特征后具有可解释性
      • 4、多元线性回归的正态性:其中有元素并不是正态分布的,独立正态分布,整体正态分布问题
    • 解决方案:
      • 既然最后要考虑可解释性的问题,那就先从可解释性的意义出发反反向推出必定需要的变元。以一种简单的二元合金为例,假设它由两种元素A和B组成,其中铌元素是B元素。当铌元素的含量增加时,材料的杨氏模量通常会减小。这是因为铌原子比A原子半径大,加入铌原子可以扰动材料中的晶格结构,导致晶格的弹性势能下降,从而导致杨氏模量的下降。
  • 下一步的主要研究任务、具体设想与安排

    • 1.关于可解释性的问题:

      • 机器学习模型的表达式可解释性一直是一个重要的问题。由于一些机器学习模型采用的是黑盒子模型,如神经网络、支持向量机等,其内部的计算过程非常复杂,使得模型的表达式难以理解和解释。
      • 这种缺乏可解释性的特点,对于材料领域的应用而言是不可接受的,需要了解机器学习模型内部的运作机制,以便更好地解释和理解模型的预测结果,因此通过正常的方法完成工作后需要查阅文献来说明完成任务的正确性。
    • 2.关于判断材料数据多元回归适用方法的问题:

      • 可观测性:对数据进行可视化分析,查看自变量和应变量之间是否存在线性关系。(直观但非量化,只能是低维度数据)
      • 多重共线性:多元线性回归模型要求自变量之间不存在严重的多重共线性,即自变量之间不应该存在高度相关性。可以通过计算自变量之间的相关系数,来判断是否存在多重共线性。(如:计算皮尔逊相关系数,r = cov(X,Y) / (std(X) * std(Y));协方差、标准差)
      • 正态性:多元线性回归模型假设误差项服从正态分布。可以通过绘制残差分布图或正态概率图来判断误差项是否满足正态分布的假设。(绘制概率图或直方图观察数据分布,直观但并非量化)(统计检验方法:夏皮罗一威尔克 Shapiro-Wilk 检验、柯尔莫哥洛夫 Kolmogorov-Smirnov 检验)
      • 独立性与异方差性:多元线性回归模型假设误差项的方差是恒定的。可以通过检查残差是否具有异方差性来判断误差项的方差是否恒定。(看误差项是否与自变量有关)
      • 从正态性、多重共线性与独立性出发设计指标完成本毕业设计创新之处。

论文安排

  • 摘要(+英文摘要)
  • 1 绪论
  • 2 相关工作
    • GPT

  • 3 方法设计
    • 3.1 决策树算法
    • 3.2 多元线性回归分析
    • 3.3 数据适用性
  • 4 实验
    • 4.1 决策树算法实验
      • 4.1.1 数据预处理
      • 4.1.2 实验设计
      • 4.1.3 实验结果
      • 4.1.4 实验分析
    • 4.2 多元线性回归分析实验
      • 4.2.1 数据适用性分析
      • 4.2.2 实验设计
      • 4.2.3 实验结果
      • 4.2.4 实验分析
  • 5 结论
  • 6 参考文献

附录

致谢

周记

2023-02-20 至 2023-02-26 week1

  • 本周我完成了论文的任务书,任务书包括课题来源、意义与主要内容,本课题的目的要求和主要技术指标以及进度计划。我针对其所有的重点内容进行分析,通过部分文献的搜索与学习,了解本课题所需的知识结构并进行体系化的整理。
  • 下一周我会按照任务书的规划完成我的论文开题报告的内容,并配置所需要的编程环境。

2023-02-27 至 2023-03-05 week2

  • 本周我完成了论文的开题报告,其包括课题背景及意义、课题研究现状及发展趋势、研究内容及研究目标、预计的研究难点、创新点,通过更多文献的学习进一步更新了进度计划以及资料的来源,了解了材料科学的基础知识。在MacOS上配置好了所需的编程环境。
  • 下一周我会按照新的进度计划完成既定的内容,希望能材料数据的数据预处理阶段。

2023-03-06 至 2023-03-12 week3

  • 本周我完成了部分的数据预处理工作,虽然毕业设计所使用的数据量比较庞大,也属于材料领域的数据,不需要很多的清洗工作,但需要针对大量数据中的一些特征进行分析分类。因为最后需要得出的是一个表达式,在材料领域可能会因为临界值的原因导致分段的现象存在,因此对数据的了解程度是材料领域成果优秀与否的重要因素。
  • 下一周我会继续加深对本毕业设计的数据的了解程度,并学习相关的知识。

2023-03-13 至 2023-03-19 week4

  • 本周我完成了全部的数据预处理工作,对本实验所给出的数据进行了全面的了解与分类。本周还我通过学姐曾经毕业设计的方法进行了学习,并针对学姐的方法进行了简单的实验复现。
  • 下一周我会继续按照学姐的方法进行复现实验,在实践中发现问题并解决问题,进一步了解学姐毕业设计的意义所在;通过机器学习基础知识的学习进行回归模型的基础构建。

2023-03-20 至 2023-03-26 week5

  • 本周我针对学姐毕业设计的方式,进行了更多的复现实验,了解到了学姐毕业设计的目的与方法。由于本研究课题的内容是探索材料的组成-属性关系,最后要给出材料组成的四个元素对应属性的值的代数式,所以回归的方法是必不可少的,最后通过回归得到的参数需要进一步参照实际意义进行调整,拟合优度指标也需要特别构建。
  • 下一周我会对机器学习回归算法的进一步学习,了解其中对实验影响较大的因素并找出问题。

2023-03-27 至 2023-04-02 week6

  • 本周我进行了机器学习回归算法的进一步学习,通过学习发现了回归算法的优势就在于其最后得出的表达式的确定性以及误差、优度指标的可分析性。在本周的组会,与指导老师张惠然的讨论中,我了解到了需要在未来的实验中进行更多的比对,例如老师所提及的Sisso算法或是深度学习得出的结果,并加以分析。同时作为毕业论文需要有更多的创新点,设计出一套判断是否可以直接进行线性回归算法的指标来对更多、更庞大或者其他的数据集进行判断。
  • 下周我依旧会继续学习机器学习回归算法,并进一步找到项目的创新点所在。

2023-04-03 至 2023-04-09 week7

  • 本周我通过机器学习回归算法的学习,以及四维材料数据特征的提取,进行了多次机器学习回归模型的实验,能得出一个初步的逻辑表达式,但对于表达式的化学意义以及特征并没有非常清晰的了解,需要通过进一步的文献查阅以及模型结果对比来完成此内容,如对Sisso算法得出的结果进行参考。对于上周老师提及的创新点的内容进行了一定的探究,结合回归算法的直接适用方法,初步对不需要分段的数据进行了考量。
  • 下周需要进一步完成实验的全部内容,如进一步对材料数据进行分段、分类,对不同模型跑出的结果进行比对,结合物理意义解释得出的表达式。

2023-04-10 至 2023-04-16 week8

  • 本周我通过对机器学习多元线性回归算法的学习,继续在做对照实验以及特征提取的工作。相较于上一周成功的找到了一个优秀的数据分段点,并直接通过四维数据的四元线性回归已经得到了一个较好的结果。
  • 下周将要集中于已经分类的数据进行进一步分析,得到源材料数据和目标材料数据之间的关系并尝试解析。

2023-04-17 至 2023-04-23 week9

  • 本周我通过不断的对照实验以及特征提取工作,仔细分析了上次实验成功的原因就是因为找到了一个优秀的分段点的缘故。而即使找到优秀的分段点,其实还是有很多值得推敲的部分,虽然直接四维数据的拟合结果较好,但不具备物理意义,对其中两个数据构造的一个新的特征进行拟合的结果更加优秀并具备可解释性。
  • 下周我会从可解释性的角度出发找到必备的特征元素,进而加快实验。

2023-04-24 至 2023-04-30 week10

  • 本周我通过基础知识的学习,从化学特征以及性质出发找到了影响目标元素的必须特征,因而做出了对于EI(杨氏模量)变量的更优结果,并具备一定的可解释性和正确性。我也吸收了中期检查老师给出的意见和创新点,会更注重于项目的创新点而非单纯实验。
  • 下周我会着重于另外两个变量:迟滞面积以及弹性应力极限的表达式中。

2023-05-01 至 2023-05-07 week11

  • 本周我整合了上次优秀的实验结果,进行了统一的绘图、文字撰写以及统一,发现实验过程中有很多不严谨的地方以及没有考虑到的模型参数,我对其进行了一一分析,学习了这些变量会产生的影响。
  • 下周我会更注重于模型参数的分析,同时继续做相关于另外两个变量的表达式。

2023-05-08 至 2023-05-14 week12

  • 本周我对所有之前实验的模型参数R^2、RMSE、MAE、Coefficients和Intercept进行了重新统计,分析导致其结果好坏的原因,把之前埋下的伏笔全部解决了;同时我也做出了另外两个变量的表达式,在实验途中不断的整合实验结果,把出现问题的可能降到了最低。
  • 接下来我会针对论文的创新点:一批材料数据能否通过多元线性回归得到表达式的判定。

2023-05-15 至 2023-05-21 week13

  • 本周所有的实验以及论文的撰写工作全部结束,针对决策树模型的优质结果作为benchmark,将多元线性回归的结果与其进行比较,从而得出目前得出的三个分段表达式是较为优质的结果;同时,针对数据是否可以进行多元线性回归的判定,作为论文的创新点给出了较为正确的答案,感谢老师在毕业设计中的指点。
  • 接下来我会不断的润色我的论文,把整篇文章的脉络以及细节变得更加清晰,更具有观赏性。

2023-05-22 至 2023-05-28 week14

  • 本周经过老师的指导,我三次修改了我的论文并且把论文的格式以及内容进行了润色,初步达到了上海大学本科生毕业论文的要求,整篇文章的脉络以及细节变得更加清晰,更具有观赏性。
  • 下周我会将重点放在答辩PPT的制作以及文稿的撰写。

2023-05-29 至 2023-06-04 week15

  • 本周我经过老师的指导,继续多次修改了我的论文并把内容和格式进行了润色,相较于上周论文的成果,本周更加的流畅以及深入,结构清晰主题明确。同时完成了答辩工作与论文的收尾工作
  • 下周我会将重点放在后续事情的完善

2023-06-05 至 2023-06-11 week16

  • 本周我经过老师的指导完成了我的论文,相较于上周的论文成果,本周的论文更加流畅,没有了低级失误并在结构上更加的清晰。

  • 感谢张惠然老师在本论文写作写作以及毕业设计期间对我的指导,这对我来说会是未来科研道路上一个优秀的起点!

整体安排

  • 第1-2周:收集并阅读有关文献,完成开题报告和任务书,配置好必要的计算机环境。
  • 第3-4周:完成材料数据的数据预处理阶段
  • 第5-6周:构建机器学习模型
  • 第7-8周:优化机器学习模型(中期检查)
  • 第9-10周:撰写论文第一稿
  • 第10-11周:论文第一稿交由指导老师审阅,并进行修改
  • 第12周:撰写论文第二稿交由指导老师审阅,并进行修改
  • 第13-14周:程序验收,完成论文
  • 第14-15周:论文答辩,上交毕业设计成绩及论文。

全部文献

Book

制备 基本概念 性能 应用
  • Lexcellent2013:该手册主要介绍了形状记忆合金的基本概念、性能、制备方法、应用和未来发展趋势等方面的知识。
研究进展

形状记忆合金(Lexcellent2013、Jani2014、Zhu2021)是一种具有记忆效应的材料,可以在受到外力变形后恢复原始形状。它具有很多优点,比如高强度、高韧性、耐腐蚀性、耐疲劳性、耐热性等,因此被广泛应用于航空航天、汽车制造、医疗器械、机器人等领域。下面是形状记忆合金研究进展和技术总结的一些内容:

研究进展:
近年来,形状记忆合金的研究重点主要集中在以下几个方面:
(1) 纳米结构调控:通过控制合金的化学组成和热处理工艺等手段,制备出具有不同晶粒尺寸和形貌的形状记忆合金,在性能上得到进一步提高。

(2) 微机电系统(MEMS)应用:将形状记忆合金与微加工技术相结合,可以实现微小结构的运动和变形,为MEMS的发展提供了新的途径。

(3) 智能材料应用:利用形状记忆合金的智能性能,可以开发出具有自修复、自感应、自适应等特性的新型材料。

技术总结

形状记忆合金的应用需要考虑到多方面的因素,包括:
(1) 合金组成:合金的组成直接影响其性能表现,需要选择合适的化学元素进行合金化。

(2) 热处理工艺:热处理可以改善形状记忆合金的形状记忆效应和机械性能,需要根据具体应用情况进行优化。

(3) 加工工艺:形状记忆合金的加工难度较大,需要选择合适的加工方法,如热加工、冷加工和微加工等。

(4) 应用环境:形状记忆合金的应用环境需要考虑到温度、压力、腐蚀等因素对其性能的影响。

总之,形状记忆合金具有广泛的应用前景,但其研究和应用仍需要进一步探索和完善。

Ti Ni Nb 石墨烯

这篇文献主要介绍了一个用于描述域墙运动的微观理论,并在铁铝合金域生长动力学的实验验证中得到了应用。(Cahn1977)✅
主要研究了具有bcc晶体结构的Ti-24Nb-4Zr-8Sn单晶的弹性性质。作者使用共轭梯度法优化了该合金单晶的晶胞参数,并通过第一性原理计算得到了其弹性常数。研究结果表明,该合金单晶的杨氏模量、剪切模量、泊松比等弹性常数与其晶向有关,并且在不同的晶向上表现出不同的各向异性。此外,作者还比较了实验测量值和计算结果的差异,讨论了计算误差来源和改进方法。(Zhang2011)✅

该文献主要研究了合金组成对钛合金β相稳定性的影响。通过实验和计算分析,作者发现当钛合金中的β稳定元素被部分或完全取代时,β相会发生固溶体不稳定性,形成α相和ω相。作者还研究了这种相变现象与微观组织、力学性能和生物相容性之间的关系。研究结果有助于了解和优化钛合金的结构和性能。(Zheng2016)✅
对点缺陷和线缺陷对石墨烯力学和热学性质的影响进行综述和分析(Rajasekaran2016)✅

这篇论文是关于NiTi形状记忆合金单晶循环相变和超弹性的相场建模研究(Xie2018)✅
纳米尺度下浓度调制对多功能合金马氏体转变的影响。通过将Nb和Ti的浓度调制到奥氏体矩阵中,研究了其对合金组织和力学性能的影响。(Zhu20192)✅

镍(Ni)含量对Ni-CrSiN涂层结构、机械和摩擦性能的影响,以及在海水中的耐蚀性能(Wang2020)✅
这篇文章主要介绍了一种新型的三明治式TiNb/NiTi复合材料的制备及其超弹性能和生物相容性研究。该材料由两个NiTi形状记忆合金片夹着一层TiNb合金夹层组成,具有优异的超弹性能和生物相容性。作者还对复合材料的超弹性能进行了研究,表明其超弹性能受NiTi形状记忆合金片数量、TiNb夹层厚度以及应变速率等因素的影响。该研究为制备高性能、多功能的生物医用材料提供了新思路。(Guo2020)✅

这篇文章主要介绍了一种新型的Nb/TiNi纳米复合材料的制备方法——包覆式累积轧制(packaged accumulative roll bonding,PARB)以及其力学性能。研究人员采用PARB方法将Nb和TiNi层交替堆叠后轧制,形成了纳米复合材料。研究发现,相较于传统的累积轧制方法,PARB制备的复合材料具有更好的组织均匀性和更优异的力学性能,包括更高的强度、更好的延展性和更好的耐疲劳性能。这些性能优异的纳米复合材料在航空航天、汽车、生物医学等领域都具有广阔的应用前景。(Jiang2020)✅

新型纳米复合材料 & 合金

这项研究为制备具有多种性能的新型金属纳米复合材料提供了一种新思路,同时也为设计和制备具有优异力学性能的金属材料提供了重要的参考。(Hao2013) ✅

该文献的主要内容是研究多功能合金的“树胶状”超弹性的内在机制。通过实验和模拟的方法,作者发现该超弹性不是由位错运动引起的,而是由多相共存引起的。(Liu20132)✅

介绍了一种基于超细纳米颗粒结构的3-1型多铁纳米复合材料,具有巨大的磁电效应。作者们使用高温合成法制备了铁酸铌和铁酸钡的纳米复合材料,并发现其磁电系数非常高。(Lich2015)✅

这篇文献主要探讨了一种纳米超材料中存在的层次结构铁电和铁磁极化。研究者们通过制备一种由具有不同铁电极化方向的铁电晶体构成的复合纳米结构,并在其上部署了一个磁性薄膜,使得复合结构中同时存在着铁电和铁磁性质。(Shimada2015)✅

一种基于纳米线形状记忆合金复合材料的高强度、低模量超弹性的来源。作者通过实验研究,发现这种合金材料的超弹性和高强度主要来源于两个因素:一是纳米线形状记忆合金的相变驱动变形能力,二是纳米线与基体之间的相互作用力。在这种复合材料中,纳米线的数量和大小对材料的性能具有重要影响。通过调节纳米线的数量和大小,可以实现对材料性能的优化。(Zhang20172)✅

制备一种使金属材料具有超低模量和近乎零滞后的线性超弹性的方法(Zhu2019)✅

一种通过纳米尺度的浓度梯度工程实现控制应变释放的方法,从而制备具有线性超弹性的金属材料(Zhu2020)✅

该文献主要介绍了一种名为“amalgamation seeded growth”的新方法,用于控制合金纳米晶的大小和组成。(Clarysse2021)✅
钢材中晶粒细化的热力学机制,包括化学成分调整、热处理工艺、机械变形等方面。(Nasiri2021)✅

马氏体 & 相场

这篇文献主要介绍了一种基于三维场理论的计算机模型,用于模拟金属中马氏体相变的形变和微观结构演化过程。作者在文中详细描述了该模型的基本原理和计算方法,并探讨了该模型在研究材料中相变和微观结构演化方面的应用前景。此外,文章还探讨了不同因素对相变行为的影响,如应力和温度的变化等。该研究对于深入理解金属中相变行为及其宏观和微观特性具有重要意义。(Wang19972)✅

该文献主要介绍了相场模型在材料微观结构演化方面的应用和发展。首先讨论了相场模型的基本原理和方程,包括自由能的形式和演化方程的推导。然后介绍了相场模型在几种典型材料演化中的应用,包括凝固、固溶体相分离、晶粒生长和相变等。此外,还讨论了相场模型与实验、计算机模拟等方法的结合,以及相场模型在材料设计和优化方面的应用。最后,展望了相场模型的未来发展方向。(Chen2002)✅

三维Landau理论用于描述多变量应力诱导马氏体相变的过程。(Levitas2002)✅

用相场方法建模马氏体相变的研究(Mamivand2013)✅

在纳米尺度下通过浓度调制实现定时马氏体相变的方法和机制(Zhu2017)✅

使用相场方法对纳米复合形状记忆合金中马氏体相变的模拟。相场模型被用来考虑马氏体相变的动力学和热力学过程,并考虑预应力的影响。作者通过相场模拟分析了纳米复合形状记忆合金中马氏体相变的晶粒结构、形貌和应力分布,并对纳米复合形状记忆合金中马氏体相变的过程进行了深入的理论研究。此外,作者还探究了纳米复合形状记忆合金中马氏体相变的预应力效应,以及晶粒大小、形貌和分布等微观结构对其性能的影响。(Wang20192)✅

高通量

这篇论文主要介绍了高通量计算材料设计的概念、方法和应用。高通量计算材料设计是指通过计算机模拟和数据挖掘技术,从已知材料数据库中高效地筛选出最有潜力的新材料,并预测其性质和应用。这种方法可以大大缩短新材料研发的时间和成本,为材料科学和工业领域的创新提供了新思路和工具。该论文详细介绍了高通量计算材料设计的流程和工具,并举了一些成功的应用案例,展示了这种方法的巨大潜力和优势。(Curtarolo2013)✅

主要介绍了材料科学领域中通过设计实现材料的出色性能的研究进展,特别是在利用计算方法和高通量试验技术进行材料设计方面的进展。(Zhou2013)✅

介绍了一种通过设计制备具有超高压电效应的铁电陶瓷的方法。作者利用组合高通量计算、材料制备和性能测试,成功地设计制备出了一种新的铁电陶瓷(Li2018)✅

介绍了一种基于高通量相场模拟的方法,用于设计高能量密度聚合物纳米复合材料。该方法使用了一种高通量相场方法,结合了分子动力学和相场模拟的优势,可以在大规模计算机群上进行高效计算。(Shen2018)✅

该文献的主要内容是介绍利用高通量筛选方法寻找新型高性能热电材料的研究。热电材料是能够将热能转化为电能或将电能转化为热能的材料,具有广泛的应用前景,如能源转换和废热利用。(Li2019)✅

这篇论文主要介绍了一种基于高通量密度泛函微扰理论(DFT-PERT)和机器学习的方法,用于预测红外、压电和介电响应等物理性质。(Choudhary2020)✅

一种基于高通量数据和机器学习的方法,用于设计高能量密度聚合物纳米复合材料的界面。该方法通过结合多尺度模拟和统计学习算法,对界面进行大量计算和预测,并在材料学中开创了新的界面设计思路。(Shen2020)✅

这篇文献的主要内容是介绍如何使用高通量的相场模拟和机器学习技术来研究电阻性随机存取存储器(RRAM)中的电阻式开关现象。(Zhang2020)✅

这篇文献主要介绍了一种基于自旋轨道交互作用(SOI)和溢出筛选方法(spillage screening)的高通量计算方法,用于搜索具有磁性和非磁性的二维拓扑材料。(Choudhary20202)✅

机器学习

介绍了一种基于机器学习的多目标优化工作流程,用于增强油藏中CO2的回收,即CO2-EOR项目。作者首先建立了一个复杂的模拟模型来模拟CO2-EOR过程中的多个参数,并将其用于机器学习算法的训练。然后,作者利用该算法对多个参数进行了优化(You2020)

材料

该文献的主要内容是关于材料的结构相变的群论描述,特别是描述转变路径退化现象的方法。文献中提出了一种使用群论描述转变路径退化的方法,通过将空间群对称性中的所有可能的操作拆分成不同的变换链,并使用约化步骤确定所有可能的路径。通过这种方法,作者能够描述几种具有相同化学成分但具有不同结构的合金中的相变退化。这种方法可以帮助材料科学家更好地理解结构相变中的复杂行为,以便更好地设计材料。(Gao2016)

多元线性回归

该书是关于应用线性回归模型的教材,包括多元线性回归的拟合、假设检验、变量选择和模型诊断等方面。书中还提供了实际数据集和软件使用指南。(Kutner2004)

本书介绍了线性回归的理论和实际应用,包括多元线性回归的推导和假设检验、变量选择和模型诊断等方面。书中还提供了R语言代码和实际数据集供读者练习。(Rencher2008)

书是关于回归分析的基础教材,讲述了多元线性回归的基本原理和应用,如模型选择、方差分析和诊断。书中还包含了R软件的使用指南。(Montgomery2012)

该书是关于多元数据分析的经典教材,介绍了多元线性回归的基本原理和应用,包括模型选择、变量选择和模型诊断等方面。书中还讲述了其他多元分析方法,如主成分分析和聚类分析等。(Hair2013)

该论文提出了一种改进的多元线性回归算法,基于梯度下降法来解决传统算法中的收敛速度较慢和易陷入局部极小值等问题。该方法利用梯度下降法来寻找使得损失函数最小化的系数,从而实现对多元线性回归模型的优化。(Liu20182)

内容简介:本书介绍了回归分析和时间序列分析的基本原理和实际应用,包括多元线性回归的拟合、模型选择和诊断等方面。书中还提供了实际数据集和R软件的使用指南。(Bowerman2018)

  • Post title:GraduationDesign
  • Post author:Picasun
  • Create time:2023-02-22 10:56:56
  • Post link:https://redefine.ohevan.com/2023/02/22/GraduationDesign/
  • Copyright Notice:All articles in this blog are licensed under BY-NC-SA unless stating additionally.