2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于短文本情感增强的在线学习者成绩预测方法

叶俊民 罗达雄 陈曙

吴伟, 刘洋, 刘威, 吴国弘, 马万经. 自动驾驶环境下交叉口车辆路径规划与最优控制模型. 自动化学报, 2020, 46(9): 1971−1985 doi: 10.16383/j.aas.c190002
引用本文: 叶俊民, 罗达雄, 陈曙. 基于短文本情感增强的在线学习者成绩预测方法. 自动化学报, 2020, 46(9): 1927−1940 doi: 10.16383/j.aas.c190008
Wu Wei, Liu Yang, Liu Wei, Wu Guo-Hong, Ma Wan-Jing. A novel autonomous vehicle trajectory planning and control model for connected-and-autonomous intersections. Acta Automatica Sinica, 2020, 46(9): 1971−1985 doi: 10.16383/j.aas.c190002
Citation: Ye Jun-Min, Luo Da-Xiong, Chen Shu. Short-text sentiment enhanced achievement prediction method for online learners. Acta Automatica Sinica, 2020, 46(9): 1927−1940 doi: 10.16383/j.aas.c190008

基于短文本情感增强的在线学习者成绩预测方法

doi: 10.16383/j.aas.c190008
基金项目: 国家社会科学基金一般项目 (17BTQ061)资助
详细信息
    作者简介:

    叶俊民:华中师范大学计算机学院教授. 主要研究方向为学习分析和教育数据挖掘.E-mail: jmye@mail.ccnu.edu.cn

    罗达雄:华中师范大学计算机学院硕士研究生. 主要研究方向为自然语言处理和教育数据挖掘. 本文通信作者.E-mail: 18140663659@163.com

    陈曙:华中师范大学计算机学院讲师. 主要研究方向为软件工程和学习分析.E-mail: chenshu@mail.ccnu.edu.cn

Short-text Sentiment Enhanced Achievement Prediction Method for Online Learners

Funds: Supported by National Social Science Fund General Project of China (17BTQ061)
  • 摘要: 当前利用短文本情感信息进行在线学习成绩预测的研究存在以下问题: 1)当前情感分类模型无法有效适应在线学习社区的短文本特征, 分类效果较差; 2)利用短文本情感信息定量预测在线学习成绩的研究在准确性上还有较大的提升空间. 针对以上问题, 本文提出了一种短文本情感增强的成绩预测方法. 首先, 从单词和句子层面建模短文本语义, 并提出基于学习者特征的注意力机制以识别不同学习者的语言表达特点, 得到情感概率分布向量; 其次, 将情感信息与统计、学习行为信息相融合, 并基于长短时记忆网络建模学习者的学习状态; 最后, 基于学习状态预测学习者成绩. 在三种不同类别课程组成的真实数据集上进行了实验, 结果表明本文方法能有效对学习社区短文本进行情感分类, 且能够提升在线学习者成绩预测的准确性. 同时, 结合实例分析说明了情感信息、学习状态与成绩之间的关联.
  • 硅是最重要的半导体材料. 据统计, 全球95 %以上的半导体器件和99 %以上的集成电路采用硅单晶作为衬底材料, 因此稳定、高效、高品质的硅单晶生产对信息产业安全可靠发展以及持续技术创新起到至关重要的支撑作用. 直拉法(Czochralski法, Cz法)晶体生长工艺是目前生产大尺寸、电子级硅单晶的主要方法[1-3]. 其原理是将石英坩埚中的多晶硅原料熔化, 并经过引晶、放肩、等径和收尾等一系列步骤, 最终从硅熔体中提拉出圆柱形的硅单晶, 生长工艺流程如图1所示.

    图 1  Cz法硅单晶生长工艺流程
    Fig. 1  Cz silicon single crystal growth process

    Cz法硅单晶生长的主要目的是提拉出的硅单晶具有等直径、杂质少、低缺陷等优点[4-5]. 晶体直径是硅单晶生长过程中一个重要的控制目标, 精准的直径控制不但可以避免晶体内部位错缺陷生成的可能性, 而且能够提高后续加工的晶体利用率. 为此, 研究人员提出了多种晶体直径控制方法并应用于实际生产[6-8]. Zheng等根据Cz法硅单晶生长过程中能量、质量平衡、流体力学和几何方程建立了晶体半径和晶体生长速率的集总参数模型, 并利用工业运行数据验证了模型的有效性[9]. Abdollahi和Dubljevic针对晶体半径和温度提出了分布式参数模型, 该模型能够准确地描述系统动力学行为和晶体内部温度分布状态[10]. Winkler等基于弯月面处晶体半径变化与晶体倾斜角之间的关系, 建立了晶体生长过程的流体力学和几何模型, 避免了热动力学建模的复杂性. 同时, 设计了晶体半径和生长速率的双PID控制系统, 并获得了比较接近实际过程的控制效果[11-12]. Rahmanpour等针对Cz法硅单晶生长过程的非线性和大滞后特性, 设计了基于模型的提拉速度和加热器功率两个协同工作的模型预测控制器(Model predictive control, MPC), 用于控制晶体半径和熔体温度, 并获得了良好的控制性能[13]. 然而, 传统基于模型的控制器设计策略很难应用于实际硅单晶生长过程控制, 且晶体提拉速度的不断变化容易导致硅单晶品质降低. 通常, 影响晶体直径变化的主要操纵变量是加热器功率和晶体提拉速度[14]. 其中, 晶体提拉速度优化调节范围窄, 而且频繁的变化会导致生长界面波动剧烈, 容易产生断晶和缺陷生成的可能性, 而加热器功率对晶体直径的调节是一个缓慢的时延过程, 具有调节范围大、不易导致生长界面波动的优点[3, 15]. 因此, 如何建立加热器功率与晶体直径之间的硅单晶生长过程模型和设计良好的直径控制器是实现硅单晶高品质生长的关键性问题.

    机理模型和数据驱动模型是晶体直径控制的两种常用模型. Cz法硅单晶生长过程处于高温、高压、多场耦合的环境中, 机理不明, 且是一个具有大滞后的非线性慢时变动态过程[1], 所以机理模型难以建立且很难实际应用于硅单晶生产过程控制. 然而, 数据驱动控制可以直接利用数据实现复杂工业过程建模和控制, 且已受到学术界的广泛关注[16-17]. 因此, 针对Cz法硅单晶生长过程中复杂的动态特性, 基于数据驱动的晶体直径建模与控制是一种可行途径. 近年来, 随着人工智能技术的迅速发展和普及, 许多机器学习方法和深度学习模型被广泛应用于工业过程建模. 然而, 单一的模型往往难以达到预期的预测效果, 所以研究人员基于“分而治之”原理提出了混合集成建模方法. 相比单一模型, 混合集成建模方法综合了不同模型的优点, 具有令人满意的预测效果[18-20]. 实际硅单晶生长过程中的数据(加热器功率、晶体直径等)包含了大量反映硅单晶生产运行和产品质量等关键参数的潜在信息, 所以采用混合集成建模方法建立硅单晶生长过程的预测模型, 具有无需显式建模晶体生长系统内部状态以及减少建模成本和提高建模精度的优点. 预测控制是工业实践中先进控制的主导技术, 具有处理大滞后、非线性、不确定性的良好能力[21-22]. 因此, 针对具有大滞后、非线性、慢时变动态特性的Cz法硅单晶生长过程, 预测控制方法可以作为晶体直径控制的首选方法. 然而, 复杂的硅单晶生长过程使得优化晶体直径目标函数的求解变得十分困难, 常用的非线性优化方法, 如最速下降法、牛顿法等很难方便实施应用, 且这些方法要求解空间具有凸性, 有的算法还要求目标函数具有二阶或高阶导数. 相比之下, 启发式优化算法对所求解问题的数学模型要求不高, 常被用于复杂目标函数的优化求解[23-24], 如遗传算法(GA)和蚁狮优化(ALO)等. ALO算法是一种无梯度的优化算法[25], 具有可调参数少、求解灵活且易于实现等优点, 非常适合求解目标函数复杂的硅单晶直径预测控制问题.

    本文在不依赖Cz法硅单晶生长过程的任何数学模型信息的情况下, 根据“分而治之”原理和工业运行数据提出了一种基于混合集成建模的晶体直径自适应非线性预测控制方法(自适应 Nonlinear model predictive control, 自适应NMPC), 该方法由晶体直径混合集成建模和晶体直径预测控制组成. 其中, 晶体直径混合集成预测模型包括三个模块: 数据分解模块, 预测模型模块, 数据集成模块. 数据分解模块采用WPD将原始的硅单晶生长实验数据分解为若干子序列, 目的在于减少数据中的非平稳性和随机噪声; 预测模型模块通过ELM和LSTM网络分别对近似(低频)子序列和细节(高频)子序列进行晶体直径离线建模; 数据集成模块则利用WPD重构各个子序列晶体直径预测模型的预测结果, 以得到晶体直径的整体预测输出. 另外, 在基于混合集成预测模型的晶体直径自适应NMPC中, 考虑到晶体直径混合集成模型可能存在模型失配问题以及目标函数求解难的问题, 采用了ALO算法在线更新预测模型参数并获取满足约束的最优加热器功率控制量. 最后, 通过工程实验数据仿真验证了所提方法在硅单晶直径预测建模和控制方面的可行性和先进性.

    Cz法硅单晶生长过程是一个非线性、大滞后的慢时变动态过程, 单晶炉内的高温、多相、多场耦合环境使得内部反应状态难以检测, 因此晶体生长机理不清, 基于机理模型的硅单晶直径控制难以实施. 为此, 本文以单晶炉制备硅单晶的历史实验数据为基础, 采用如下非线性自回归滑动平均(Nonlinear autoregressive moving average with eXogenous inputs, NARMAX)模型来描述加热器功率与晶体直径之间的关系:

    $$\begin{split} y(k) =& {f_{NARMAX}}(u(k - d), \cdots ,u(k - d - {n_u}),\\ &y(k - 1), \cdots ,y(k - {n_y})) \end{split}$$ (1)

    其中, ${f_{NARMAX}}( \cdot )$为未知的非线性映射函数; $d$为加热器功率与晶体直径之间的时滞阶次, ${n_u}$${n_y}$分别是模型输入输出阶次, $y(k)$$u(k)$分别表示$k$时刻系统的晶体直径输出和加热器功率控制输入.

    对于式(1)所表述的Cz法硅单晶生长系统, 本文采用混合集成建模方法建立其模型. 考虑到混合集成建模方法是基于“分而治之”原理, 同时为了综合不同模型的优点, 基于历史加热器功率输入数据和晶体直径输出数据, 我们采用机器学习方法ELM和深度学习方法LSTM建立晶体直径预测模型. 其中, ELM方法具有快速的训练和预测速度[26-27], 能够节省晶体直径建模成本, 而LSTM方法可以学习长期依赖的信息, 能够抓取数据序列中的时间特征, 非常适合处理具有非线性特征的数据序列回归问题[28-29]. 具体的晶体直径混合集成建模流程将在第1.2节给出.

    在硅单晶生长过程控制中, 建立准确的晶体直径预测模型是实现其控制的基础[3]. 为了准确辨识式(1)中的时滞$d,$本文提出了一种基于互相关函数的时滞优化估计方法, 其中互相关系数的估计如下式:

    $${\hat \phi _{uy}}(d) = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {\dfrac{({u_{i - d}} - {\mu _u})({y_i} - {\mu _y})}{{s_u}{s_y}}} \right|} $$ (2)

    其中, $u$$y$可以分别表示历史的加热器功率数据序列和晶体直径数据序列, ${\mu _u}$${\mu _y}$${s_u}$${s_y}$分别是加热器功率和晶体直径数据的均值和标准差.

    根据互相关系数式(2), 可以将时滞估计问题转化为如下的优化问题:

    $$\left\{ {\begin{array}{*{20}{l}} \mathop {\max }\limits_d g(y,u) = f(y,u(i - d))\\ {\rm s.t}.\;{\rm{ }}{d_{\min }} \le d \le {d_{\max }} \end{array}} \right.$$ (3)

    其中, $f( \cdot )$表示互相关系数${\hat \phi _{uy}}(d).$${d_{\min }}$为时滞阶次的下界, ${d_{\max }}$为时滞阶次的上界.

    基于上述时滞优化问题式(3), 本文采用ALO算法进行时滞阶次寻优, 并将式(3)作为待优化的适应度函数, 从而确定式(1)中的时滞阶次$d$.

    在辨识获得时滞阶次$d$的前提下, 本文提出了一种基于Lipschitz商准则[30]和模型拟合优度[31]的晶体直径模型阶次辨识方法. 所提辨识方法不仅可以保证模型估计精度, 而且无需模型阶次的先验知识, 不需要经历复杂优化过程且容易实现. 针对式(1), 将其写成更一般的形式, 如下

    $$y = {f_{NARMAX}}({x_1},{x_2}, \cdots ,{x_m})$$ (4)

    其中, $m$是变量个数且$m = {n_u} + {n_{y }}+ 1.$$ X = [ {x_1},$${x_2}, \cdots ,{x_m} ] \rm ^T$表示${f_{NARMAX}}( \cdot )$的输入向量, 即历史的加热器功率与晶体直径数据.

    定义Lipschitz商如下

    $${q_{i,j}} = \frac{{\left| {y(i) - y(j)} \right|}}{{\left| {x(i) - x(j)} \right|}},i \ne j$$ (5)

    其中, $\left| {x(i) - x(j)} \right|$表示两个输入向量之间的距离, 而$\left| {y(i) - y(j)} \right|$则表示晶体直径输出${f_{NARMAX}}(x(i))$${f_{NARMAX}}(x(j))$之间的距离. 将Lipschitz商式(5)展开可得

    $$q_{i,j}^{(m)} = \frac{{\left| {y(i) - y(j)} \right|}}{{\sqrt {{{({x_1}(i) - {x_1}(j))}^2} + \cdots + {{({x_m}(i) - {x_m}(j))}^2}} }}$$ (6)

    其中, $q_{i,j}^{(m)}$的上标$m$表示式(3)中的变量个数. 根据参考文献[32]可知, $q_{i,j}^{(m)}$可以被用来表示非线性系统的输入是否遗漏了必要变量或者加入了多余变量. 当一个必要的输入变量${x_m}$被遗漏时, Lipschitz商$q_{i,j}^{(m - 1)}$将会远远大于$q_{i,j}^{(m)},$甚至表现为无穷大. 相反地, 当一个多余变量${x_{m + 1}}$被加入时, Lipschitz商$q_{i,j}^{(m{\rm{ + }}1)}$将会略小于或者大于$q_{i,j}^{(m)},$差别不会很明显. 为了减小噪声对辨识结果的影响, 本文采用指标式(7)来选择晶体直径模型${f_{NARMAX}}( \cdot )$中的变量个数, 即

    $${q^{(m)}} = {\left( {\prod\limits_{i = 1}^p {\sqrt m {q^m}(i)} } \right)^{\frac{1}{p}}}$$ (7)

    其中, ${q^m}(i)$是所有的Lipschitz商$q_{i,j}^{(m)}$中第$i{\rm{ - }}th$的最大值, 而 $p$是一个正数, 通常满足$p \in \left[ {0.01N,0.02N} \right].$然后, 定义停止准则评价指标$\Gamma (m + 1,m)$如下:

    $$\Gamma (m + 1,m) = \frac{{\left| {{q^{(m + 1)}} - {q^{(m)}}} \right|}}{{\max (1,\left| {{q^{(m)}}} \right|)}} < \varepsilon $$ (8)

    其中, 本文将阈值$\varepsilon $取为0.01. 通过Lipschitz商准则, 可以很准确地得到最佳变量个数$m$, 再结合晶体直径模型拟合优度式(9), 将拟合优度最高值确定为最优晶体直径模型阶次组合, 从而实现对晶体直径系统式(1)的输入输出阶次辨识.

    $${\rm{Fit}} = 100\; {\text{%}} \times \left( {1 - \frac{{\left\| {y - \hat y} \right\|}}{{\left\| y \right\|}}} \right)$$ (9)

    其中, $y$是晶体直径实际值, $\hat y$是ELM网络的晶体直径预测值.

    针对硅单晶生长过程机理建模难问题, 采用数据驱动建模方法可以直接使用传感器获取的测量数据, 而无需显式建模晶体生长系统内部的状态, 减少了晶体直径建模成本和时间. 混合集成建模方法是基于“分而治之”原理, 利用多个子模型进行预测建模, 从而在预测中产生协同效应, 克服了单一模型预测性能不佳的缺点. 因此, 本文提出了一种新颖的WPD-ELM-LSTM混合集成建模方法, 并将其应用于硅单晶直径建模, 整体的建模框架, 如图2所示.

    图 2  基于WPD-ELM-LSTM的混合集成建模框架
    Fig. 2  Hybrid integrated modeling framework based on WPD-ELM-LSTM

    晶体直径混合集成建模过程主要包括两个阶段. 在第一阶段, 由于单晶炉内复杂的生长环境, 各种不确定性因素导致采集的晶体直径数据呈现出非平稳、非线性的特征, 所以本文选用应用广泛且可靠的WPD信号分解方法, 将原始晶体直径数据序列分解成不同的低频和高频平稳信号, 目的在于减少非平稳性、非线性特征以及满足基于“分而治之”原理对不同频率信号进行预测建模的需求. 通常, 低频子序列和高频子序列分别被称为近似子序列和细节子序列. 与低频分量相比, 高频分量具有较大的随机性, 包含了不确定性的随机噪声, 因此本文去除了最高频子序列, 从而减少了随机噪声对预测性能的影响. 在第二阶段, 首先将获得的子序列划分为训练集和测试集; 其次, 由于近似子序列包含了原始晶体直径数据固有的本征信息, 所以我们采用建模速度快和泛化能力强的ELM进行预测建模; 细节子序列是一个高频的非线性信号序列, 为了更准确地捕获晶体直径数据序列中的时间特征信息, 我们使用了具有时间记忆功能的LSTM网络进行预测建模. 然而, ELM和LSTM网络的隐含节点个数对预测性能有较大的影响, 为了得到最佳的晶体直径预测效果, 采用ALO算法进行隐含节点个数寻优, 并将晶体直径预测值与实际值之间的均方根误差作为待优化的适应度函数, 从而获取最优节点个数. 最后, 通过WPD重构所有子序列预测模型的预测结果, 以得到晶体直径的整体预测输出. 与传统单一预测建模方法相比, 混合集成建模方法能够捕捉原始数据的内在特征, 学习历史数据之间的相互依赖关系, 从而有效地提高整体预测能力.

    等径阶段的晶体直径控制是Cz法硅单晶生长过程的核心, 精准的直径控制, 一方面有利于减小生长界面的热应力波动, 避免位错缺陷生成的可能性, 另一方面可以提高后续晶体加工利用率[33]. 目前, 在Cz法硅单晶实际生产线上, 普遍采用的是PID控制. 然而, 非线性、时变性和大滞后特性的存在, 不但使得传统的PID控制难以实现精确的直径跟踪控制和约束处理, 而且容易降低晶体生长系统的可靠性. 因此, 为了提高硅单晶直径控制性能, 所提自适应非线性预测控制方法能够很好地解决这些潜在的问题.

    晶体直径预测控制的控制性能依赖于所建混合集成预测模型的预测性能, 当被控晶体生长系统参数发生变化时, 会存在模型失配问题, 此时如果仍采用原始晶体直径预测模型的非线性预测控制器, 会导致晶体直径控制性能变差甚至不稳定, 甚至引发晶体生长失败. 因此, 为了使晶体直径预测控制系统仍能达到控制目标要求, 本文提出了一种基于ALO算法优化求解的自适应NMPC方法, 并通过ALO算法调整晶体直径混合集成预测模型的参数, 使其与晶体生长过程保持一致. 基于WPD-ELM-LSTM的晶体直径自适应NMPC结构, 如图3所示, 主要包括: 期望晶体直径参考轨迹、晶体直径WPD-ELM-LSTM预测模型、模型参数自适应更新、基于ALO算法的滚动优化、反馈校正等几个部分.

    图 3  基于WPD-ELM-LSTM的晶体直径自适应NMPC结构
    Fig. 3  Crystal diameter adaptive NMPC structure based on WPD-ELM-LSTM

    晶体直径WPD-ELM-LSTM预测模型: 根据式(1)所描述的晶体直径非线性系统, 建立其相应的WPD-ELM-LSTM混合集成预测模型. 预测模型的训练输入数据集由历史加热器功率和晶体直径数据组成, 即$X = \{ u(k - d), \cdots ,u(k - d - {n_u}),$$y(k), \cdots , y(k - {n_y})\},$输出数据集为历史晶体直径$Y = \left\{ {y(k)} \right\},$晶体直径系统的时滞阶次$d$、模型阶次${n_u}$${n_y}$可由第1.1节所提模型辨识方法确定. 晶体直径WPD-ELM-LSTM预测模型可由第1.2节所提的建模方法建立. 所建立的晶体直径混合集成预测模型的目的是为求解晶体直径预测控制优化问题提供可靠的基础.

    根据建立的晶体直径混合集成预测模型, 从$k$时刻起利用系统的当前信息和未来的加热器功率控制输入, 可以预测出未来的晶体直径预测值${y_m}$, 然后经过在线反馈校正为滚动优化问题提供所需的未来晶体直径控制预测输出${y_p}$.

    基于ALO算法的滚动优化: 本文所设计的晶体直径非线性预测控制是一种有限时域内的滚动优化过程. 定义$k$时刻的加热器功率控制输入信号为$U = {\left[ {u(k),u(k + 1), \cdots ,u(k + N - 1)} \right]\rm^T}.$在采样时刻$k,$优化式(10)所示的性能指标.

    $$\left\{ \begin{array}{*{20}{l}} \min {\rm{ }}J(u) = \displaystyle\sum\limits_{j = 1}^{{N_p}} {{{\left[ {{y_r}(k + j) - {y_p}(k + j)} \right]}^2} + } \\ \qquad\qquad {\rm{ }}\displaystyle\sum\limits_{j = 1}^{{N_c}} {r{{\left[ {\Delta u(k + j - 1)} \right]}^2}} \\ {\rm{s}}{\rm{.t}}{\rm{. }}\;\Delta {u_{\min }} \le \Delta u \le \Delta {u_{\max }},\\ \qquad{u_{\min }} \le u \le {u_{\max }} \end{array} \right.$$ (10)

    其中, ${N_p}$为预测时域, ${N_c}$为控制时域, ${N_p} \geqslant {N_c}$, $r$为控制权系数. $\Delta u(k) = u(k) - u(k - 1)$; ${y_p}(k + j)$是第$j$步晶体直径混合集成预测模型的预测输出; ${y_r}(k + j)$是第$j$步晶体直径参考输出, 其由式(11)所示的参考轨迹给出.

    晶体直径自适应NMPC的核心是式(10)所示非线性约束优化问题, 由于建立的WPD-ELM-LSTM混合集成预测模型相对复杂, 难以采用传统优化算法进行求解. 而ALO算法是一种模拟蚁狮与蚂蚁之间狩猎行为及相互作用机制的全局优化搜索方法, 具有潜在的并行性和鲁棒性. 此外, ALO算法是一种无梯度的算法, 它把优化问题看作一个黑盒, 很容易应用于实际复杂工业优化问题的求解, 算法的具体实现过程, 可以参考文献[25]. 本文正是基于ALO算法的优点, 通过求解晶体直径预测控制性能指标函数式(10), 获得一组最优的加热器功率控制序列U, 但仅对硅单晶生长系统施加第一个控制量${u^ * }(k).$

    参考轨迹: 针对上述晶体直径自适应非线性预测控制过程, 为了把当前晶体生长系统输出的晶体直径$y(k)$平滑地过渡到真实设定值 $y_{sp},$定义${y_r}(k + j)$为第 j 步的晶体直径参考输出, 即

    $$\left\{ {\begin{array}{*{20}{l}} {{y_r}(k) = y(k)}\\ {{y_r}(k + j) = \eta {y_r}(k + j - 1) + (1 - \eta ){y_{{{sp}}}}} \end{array}} \right.$$ (11)

    其中, $ \eta \; (0 < \eta < 1)$为柔化系数, 用以调整系统的鲁棒性和收敛性.

    反馈校正: 为了克服所建立的晶体直径混合集成预测模型与晶体生长被控系统之间的模型失配和外部干扰对控制系统的影响, 通过反馈校正对晶体直径预测输出补偿, 即

    $$\left\{ {\begin{array}{*{20}{l}} e(k) = y(k) - {y_m}(k)\\ {y_p}(k + j) = {y_m}(k + j) + h \times e(k) \end{array}} \right.$$ (12)

    其中, $h$为补偿系数, ${y_m}$是晶体直径混合集成预测模型WPD-ELM-LSTM的预测输出, ${y_p}$是经过反馈校正的晶体直径预测输出.

    Cz法硅单晶生长过程存在各种不确定性因素(熔体对流、氩气流动等), 使得所建立的晶体直径混合集成预测模型难免与实际系统存在偏差. 另外, 当实际晶体生长过程的结构参数发生变化造成模型失配时, 会导致晶体直径预测模型的输出和实际输出之间的误差增大, 因而难以获得满意的晶体直径预测控制性能. 为此, 进一步引入模型参数自适应估计方法[34], 通过最小化晶体直径混合预测模型输出和实际输出之间的误差, 在线调整预测模型WPD-ELM-LSTM的参数集. 考虑到近似子序列的ELM预测模型包含着晶体直径固有的本征信息, 且方便在线实施模型参数估计, 所以本文主要调整ELM网络的输入权值$W$和偏置 b, 以保证晶体直径混合集成预测模型的准确性. WPD–ELM–LSTM模型参数估计的性能指标, 如式(13)所示:

    $$\left\{ {\begin{array}{*{20}{l}} {\mathop {\min {\rm{ }}}\limits_\theta {J_\theta } = {{\left[ {y(k) - {{\hat y}_\theta }(k)} \right]}^2} + \psi \displaystyle\sum\limits_{m = 1}^{{n_\theta }} {{{\left( {\Delta {\theta _m}(k)} \right)}^2}} }\\ {\rm{s}}{\rm{.t}}{\rm{. }}\;{{\hat y}_\theta }(k) = {{\hat y}_{{\theta _{ELM}}}}(k) + {{\hat y}_{LSTM}}(k)\\ \quad\;\; {\rm{ }}\Delta {\theta _m}(k) = {\theta _m}(k) - {\theta _m}(k - 1) \end{array}} \right.$$ (13)

    其中, $\theta $为ELM网络中的参数$\left\{ {W,b} \right\},$$y(k)$${\hat y_\theta }(k)$分别表示$k$时刻晶体直径系统的实际输出值和晶体直径预测模型WPD–ELM–LSTM的预测值; $\psi\; (\psi > 0)$为参数变量权系数, ${n_\theta }$表示模型参数个数; ${\hat y_{{\theta _{ELM}}}}(k)$${\hat y_{LSTM}}(k)$分别表示晶体直径近似子序列和细节子序列的预测值.

    针对上述混合集成预测模型参数估计问题, 本文将模型参数估计性能指标函数式(13)作为ALO算法优化的适应度函数, 当满足迭代终止条件时, 即可求得当前$k$时刻自适应调整后的WPD-ELM-LSTM预测模型参数值.

    基于WPD-ELM-LSTM混合集成预测模型的晶体直径自适应NMPC算法的实现步骤如下:

    1) 设定合适的控制参数包括预测时域${N_p}$、控制时域${N_c}$、柔化系数$\eta $、补偿系数$h$、控制加权系数$r$、参数变量权系数$\psi $以及ALO算法的种群个数$Num,$最大迭代次数$Ma{x_{iter}};$

    2) 离线训练晶体直径混合集成预测模型WPD-ELM-LSTM;

    3) 设定晶体直径的期望值${y_{sp}},$并按式(11)得到晶体直径参考轨迹${y_r};$

    4) 计算晶体直径混合集成预测模型的预测输出值${y_m}(k)$以及实际系统直径输出值$y(k);$

    5) 根据ALO算法求解式(13) 非线性优化问题, 以得到最优参数集$\hat \theta ,$从而更新晶体直径预测模型WPD–ELM–LSTM;

    6) 利用当前时刻晶体直径预测误差$e(k)$和未来时刻晶体直径预测值${y_m}(k + j),$经在线反馈校正式(12)得到晶体直径预测输出${y_p}(k + j);$

    7) 基于ALO算法滚动优化求解晶体直径预测控制性能指标式(10), 并获得一组最优的加热器功率控制量序列$U(k);$

    8) 将最优加热器功率控制序列的第1个控制量${u^ * }(k)$作用于当前硅单晶生长系统;

    9) 返回步骤4), 不断进行迭代求解.

    为了验证本文所提方法在实际Cz法硅单晶生长控制过程中的有效性, 本文以晶体生长设备及系统集成国家地方联合工程研究中心的TDR-150型号的单晶炉为实验平台, 图4是Cz法单晶炉生长设备及直径测量系统[35]. 从图4可知, 硅单晶是由多晶硅原料在高温、磁场等作用下经过一系列晶体生长工艺步骤所获得. 晶体直径的动态变化是通过CCD相机进行实时监测. 实验数据采集过程来源于8英寸硅单晶生长实验, 实验条件分别为: 多晶硅原料为180 kg, 炉压为20 Torr, 磁场强度为2 000高斯, 晶体旋转速度为10 r/min, 坩埚旋转速度为10 r/min, 氩气流速为100 L/min.

    图 4  Cz法硅单晶生长过程和晶体直径测量系统
    Fig. 4  Cz silicon single crystal growth process and crystal diameter measurement system

    基于上述TDR-150单晶炉拉制8英寸硅单晶现场数据库收集到的2017年2月26日至2017年3月2日的历史实验数据进行预测建模和直径控制. 由于硅单晶等径阶段的晶体生长控制不仅影响后期晶体加工的利用率, 还决定了硅单晶品质的好坏, 所以本文主要利用硅单晶等径阶段的晶体直径和加热器功率的历史测量数据, 整个硅单晶等径阶段总共历时27小时左右, 采样时间为2 s. 考虑到后续晶体直径建模的计算量, 我们从等径阶段某个时刻起间隔5个数据点连续选取5 000组实验数据, 该数据集的数据记录时间间隔为10 s, 原始实验数据如图5所示. 选取前3 800组作为训练数据集, 后1 200组作为测试数据集, 用于验证模型拟合效果. 表1是实验数据集的统计描述, 包括总样本数, 平均值(Mean), 最大值(Max), 最小值(Min)和标准差(Std).

    表 1  原始实验数据集的统计特性
    Table 1  Statistical characteristics of the raw experimental data set
    数据集数量MeanMaxMinStd
    晶体直径 (mm)
    总样本5 000208.92212.57206.160.66
    训练集3 800208.92212.57206.160.72
    测试集1 200208.92209.83208.060.41
    加热器功率 (kW)
    总样本5 00070.5272.5168.370.80
    训练集3 80070.2072.3268.370.59
    测试集1 20071.5672.5170.440.40
    下载: 导出CSV 
    | 显示表格
    图 5  原始晶体直径与加热器功率实验数据
    Fig. 5  Experimental data of raw crystal diameter and heater power

    基于上述等径阶段的历史实验数据, 并考虑到所提混合集成模型的复杂度和计算量, 采用WPD信号分解方法对晶体直径原始数据进行2层分解, 图6是分解之后的不同子序列结果.

    图 6  晶体直径原始数据分解结果
    Fig. 6  Crystal diameter raw data decomposition results

    图6中可以明显看出, 近似子序列具有晶体直径原始数据的固有本征信息特征, 代表了晶体直径数据序列的整体趋势, 而细节子序列具有高频的非线性特征反映了晶体直径数据局部波动趋势. 由于高频分量具有较大的随机性, 通常包含了不确定性的测量噪声, 所以为了保证晶体直径预测模型的准确性, 本文将具有最高频的细节子序列3移除, 利用剩余的子序列进行预测建模.

    根据晶体生长过程的先验知识, 滞后时间$t$一般在5 min ~ 25 min. 采用本文所提出的模型结构辨识方法, 首先对晶体直径模型式(1)中的时滞阶次进行辨识. ALO算法的参数设置为: 种群数$Num = 30,$最大迭代次数$Ma{x_{iter}} = 500,$时滞阶次$d$范围为$30\sim 150. $

    由于ALO算法的初始种群位置是随机生成的, 为了说明所提时滞辨识方法的准确性和可靠性, 图7是30次独立运行后的时滞阶次寻优结果. 可知, 30次独立寻优的时滞阶次未发生明显变化, 说明了所辨识的时滞是准确且可靠的, 同时也说明了ALO算法具有很强的全局搜索能力. 通过四舍五入原则确定时滞$d = 67,$即滞后时间$t = 670\;\rm s,$约为11.17 min.

    图 7  时滞阶次$d$辨识结果
    Fig. 7  Time delay order $d$ identification results

    然后, 针对式(1)中的模型输入输出阶次, 假设最高阶次为5, 采用所提模型阶次辨识方法, 初步得到表2中基于Lipschitz商准则的不同输入变量个数的评价指标值$\Gamma $. 根据停止准则评价指标$\Gamma (m + $$1,m),$可以确定最佳的输入变量个数为$m = {n_u} + $$ {n_y} + 1 = 5,$${n_u} + {n_y} = 4.$最后, 根据模型拟合优度方法可以得到不同阶次组合下的拟合优度值, 如表3所示. 依据最优拟合优度值可以确定输入阶次${n_u} = 1,$输出阶次${n_y} = 3.$

    表 2  基于Lipschitz商准则的输入变量个数辨识结果
    Table 2  Identification results of the number of input variables based on Lipschitz quotient criterion
    $\Gamma (m + 1,m)$$\Gamma (4,3)$$\Gamma (5,4)$$\Gamma (6,5)$$\Gamma (7,6)$$\Gamma (8,7)$$\Gamma (9,8)$$\Gamma (10,9)$$\Gamma (11,10)$
    指标值0.01450.01050.00880.00710.01410.00710.00330.0003
    下载: 导出CSV 
    | 显示表格
    表 3  不同阶次组合的模型拟合优度结果
    Table 3  Goodness-of-fit of the models with different order combinations
    不同阶次组合$({n_u},{n_y})$(1,3)(2,2)(3,1)
    模型拟合优度值Fit99.913299.908599.9090
    下载: 导出CSV 
    | 显示表格

    为了验证本文所提的晶体直径混合集成预测模型WPD-ELM-LSTM的有效性, 采用三种常用的统计标准来评估直径预测性能, 如表4所示.

    表 4  模型性能评价指标
    Table 4  Model performance evaluation index
    指标定义公式
    MAE平均绝对值误差${\rm MAE} = \dfrac{1}{N}\displaystyle\sum\limits_{i = 1}^N {\left| {f(i) - \hat f(i)} \right|} $
    MAPE平均绝对百分
    比误差
    ${\rm MAPE} = \dfrac{1}{N}\displaystyle\sum\limits_{i = 1}^N {\left| {\frac{ {f(i) - \hat f(i)} }{ {f(i)} } } \right|} \times 100{\rm{\% } }$
    RMSE均方根误差${\rm RMSE} = \sqrt {\dfrac{1}{N}\displaystyle\sum\limits_{i = 1}^N { { {(f(i) - \hat f(i))}^2} } } $
    下载: 导出CSV 
    | 显示表格

    表5是不同晶体直径预测方法的参数设置. 图8是所提建模方法与ELM、LSTM、WPD-ELM和WPD-LSTM方法的晶体直径预测效果以及相应的预测性能评价指标对比. 为了准确评价所提预测建模方法的有效性, 表6中比较了不同预测模型的预测性能指标. 本文所有的仿真环境配置如下: 系统Windows 10, 内存16 GB, 处理器Intel(R) Core(TM) i5-4590, 仿真软件MATLAB 2018b.

    表 5  不同预测方法的参数设置
    Table 5  Parameter setting of different prediction methods
    预测方法参数设置
    ELM20 个隐含节点数, 激活函数 sigmoid
    LSTM200 个隐含节点数, 学习率 0.005, 训练轮次 200
    WPD-ELM20 个隐含节点数, 激活函数 sigmoid
    WPD-LSTM200 个隐含节点数, 学习率 0.005, 训练轮次 200
    WPD-ELM-LSTMELM: 27 个隐含节点数, 激活函数 sigmoid; LSTM: 185 个隐含节点数, 学习率 0.005, 训练轮次 200
    下载: 导出CSV 
    | 显示表格
    表 6  不同预测模型的晶体直径预测指标
    Table 6  Prediction index of crystal diameter based on different prediction models
    模型MAE (mm)MAPE (%)RMSE (mm)
    ELM0.01970.00940.0258
    LSTM0.08780.04200.1131
    WPD-ELM0.01720.00820.0228
    WPD-LSTM0.04310.02060.0627
    WPD-ELM-LSTM0.00960.00460.0125
    下载: 导出CSV 
    | 显示表格
    图 8  不同建模方法的晶体直径预测效果及评价指标对比
    Fig. 8  Comparison of prediction effect and evaluation index of crystal diameter by different modeling methods

    根据图8所示, 所提的混合集成预测模型WPD-ELM-LSTM的晶体直径预测准确性优于其他预测模型(ELM、LSTM、WPD-ELM和WPD-LSTM). 在表6中, 与其他预测模型相比, 所提晶体直径预测模型的MAE指标分别降低了51.27 %, 89.07 %, 44.19 %和77.73 %; MAPE指标下降了51.06 %, 89.05 %, 43.90 %和77.67 %; RMSE指标减少了51.55 %, 88.95 %, 45.18 %和80.06 %. 此外, 所提混合集成预测模型WPD-ELM-LSTM的晶体直径预测值与实际值有更多的相似性, 这是因为混合集成预测模型在预测过程中产生了协同效应, 提高了整体预测结果的准确性. 总之, 所提晶体直径混合集成预测模型WPD-ELM-LSTM提高了单一ELM或LSTM模型的晶体直径预测性能, 从而显示了强大的“分解–集成”框架的学习预测能力.

    为了描述上述不同晶体直径预测模型在模型训练阶段的计算量, 表7是不同晶体直径预测模型的训练计算时间, 即离线建模时间. 可以看出集成模型WPD-ELM和WPD-LSTM的训练计算时间分别高于各自单一模型ELM和LSTM, 而在单一模型中ELM的训练计算时间小于LSTM, 从而说明了ELM具有快速训练模型的优点. 正是基于ELM的建模优点, 所以所提WPD-ELM-LSTM的训练计算时间有所减少. 总之, 由于集成模型是由多个子模型进行建模, 必然会牺牲一定的建模时间. 然而在实际应用中晶体直径离线建模的计算量很少被优先考虑. 另一方面, 随着硬件计算能力的提高以及并行计算技术的应用, 所提混合集成建模方法的计算量将会有所减少.

    表 7  不同晶体直径预测模型的训练计算时间
    Table 7  Training calculation time of different crystal diameter prediction models
    预测模型训练计算时间 (s)
    ELM0.0828
    LSTM304.4786
    WPD-ELM0.2752
    WPD-LSTM972.6920
    WPD-ELM-LSTM601.1670
    下载: 导出CSV 
    | 显示表格

    为了验证本文所提晶体直径混合集成预测模型WPD-ELM-LSTM和ALO优化求解方法在晶体直径自适应NMPC过程中的有效性. 选取预测时域${N_p}$为5, 控制时域${N_c}$为3, 柔化系数$\eta $为0.2, 控制加权系数$r$为0.3, 补偿系数$h$为0.5, 控制量约束$\Delta {u_{\min }} = - 2,$$\Delta {u_{\max }} = - 2,$${u_{\min }} = 69,$${u_{\max }} = 73,$控制量$u$的单位是kW. WPD-ELM-LSTM模型参数估计器的优化参数变量权系数$\psi = 0.03.$ALO的参数设置为种群个数$Num = 30,$最大迭代次数$Ma{x_{iter}} = 300.$根据晶体生长工艺要求, 晶体生长控制目标为: 晶体直径$y$变化范围207 mm ~ 210 mm 加热器功率$u$变化范围69 kW ~ 73 kW. 由于实际硅单晶生长过程中会存在很多不确定性干扰因素, 为了模拟检测系统在测量过程中所产生的随机误差, 同时为了验证所提控制方法的鲁棒性, 所以本文在单晶炉系统的输出中加入均值为0, 方差0.01的高斯随机噪声, 用以模拟传感器数据采集混入的高斯噪声.

    首先, 测试所提混合集成建模方法下晶体直径自适应NMPC的跟踪性能, 选取晶体直径的初始设定值${y_{sp}}$为208.5 mm, 在采样时刻150时改变晶体直径设定值${y_{sp}}$为209 mm, 得到晶体直径的设定值跟踪曲线, 如图9所示. 在外部干扰的情况下, 所提自适应NMPC方法和常规NMPC方法的晶体直径控制输出均在直径设定点附近轻微波动、超调较小, 且各自的加热器功率控制变量也在约束的范围之内. 然而, 在直径跟踪精度和快速性方面, 所提基于混合集成预测模型WPD-ELM-LSTM的晶体直径自适应NMPC控制性能优于常规NMPC, 而且加热器功率控制变量的抖动幅度相对较小. 因此, 自适应NMPC方法更适合硅单晶生长过程中的晶体直径控制.

    图 9  自适应NMPC和常规NMPC的晶体直径设定值跟踪效果
    Fig. 9  Crystal diameter setpoint tracking effect of adaptive NMPC and conventional NMPC

    然后, 验证所提晶体直径自适应NMPC在ALO优化求解下的晶体直径控制性能指标$J$收敛性、WPD-ELM-LSTM预测模型参数估计性能指标${J_\theta }$收敛性以及晶体直径预测控制的实时性. 根据上述图9晶体直径设定值跟踪仿真结果, 可以得到晶体直径自适应NMPC在单步计算过程中的控制性能指标$J$和模型参数估计的性能指标${J_\theta }$收敛曲线, 如图10所示. 从中可以看出, 晶体直径控制性能指标$J$基本在160次迭代以后, 进入稳定收敛状态, 而晶体直径预测模型参数估计的性能指标${J_\theta }$在第150次迭代以后, 也能够满足稳定收敛. 因此, 采用ALO算法求解自适应NMPC可以实现晶体直径的有效控制. 此外, 为了比较晶体直径自适应NMPC在直径设定值跟踪控制中的实时性, 表8是不同预测模型下晶体直径预测控制计算时间, 即平均控制量更新时间. 从表8中可以看出, 所提混合集成预测模型WPD-ELM-LSTM的自适应NMPC计算时间高于单一模型的计算时间, 这主要是由所建混合集成模型的复杂性导致. 另外, 基于混合集成预测模型WPD-ELM-LSTM的自适应NMPC计算时间高于常规NMPC, 这主要是因为模型参数自适应更新过程比较耗时. 然而, 硅单晶生长是一个缓慢的时变动态过程, 通过加热器功率调节晶体直径存在较大的滞后时间(5 min ~ 25 min), 且实际应用中对控制系统的实时性要求不高, 所以7.3113 s的平均控制量更新时间是可以接受的. 另外, 随着硬件计算能力的提高, 所提控制方法的计算时间将会有所减少.

    表 8  基于不同预测模型的晶体直径预测控制计算时间
    Table 8  Calculation time of crystal diameter predictive control based on different prediction models
    预测模型平均控制量更新时间 (s)
    ELM (常规NMPC)0.4512
    LSTM (常规NMPC)0.4899
    WPD-ELM-LSTM (常规NMPC)0.6841
    WPD-ELM-LSTM (自适应NMPC)7.3113
    下载: 导出CSV 
    | 显示表格
    图 10  晶体直径控制性能指标和模型参数估计性能指标收敛曲线
    Fig. 10  Convergence curve of crystal diameter control performance index and model parameter estimation performance index

    最后, 由于硅单晶生长系统是一个慢时变动态过程, 且具有大滞后特点, 因此为了进一步验证所提控制方法的应用性能以及在时滞变化情况下的稳定性, 本文将晶体生长工业中常规PID控制方法与本文方法进行对比. 设置晶体直径的期望指标${y_{sp}}$为209 mm, 补偿系数$h$为0.3, WPD-ELM-LSTM模型参数估计器的优化参数变量的权系数$\psi = 0.01,$其他晶体直径控制参数与上述设置相同; PID控制参数设置为${k_p} = 0.26,$${k_i} = 0.01,$${k_d} = 0.1.$图11是原始时滞阶次下的所提控制方法与常规PID晶体直径控制结果对比. 图12是时滞阶次$d$增大20 %和时滞阶次减少20 %的晶体直径控制结果.

    图 11  所提自适应NMPC与常规PID的晶体直径控制结果
    Fig. 11  The crystal diameter control results of the proposed adaptive NMPC and conventional PID
    图 12  时滞阶次变化时所提自适应NMPC与常规PID的晶体直径控制结果
    Fig. 12  Crystal diameter control results of adaptive NMPC and conventional PID for delay order variation

    图11可知, 所提控制方法和PID控制均能获得有效的晶体直径控制效果. 然而, 与常规PID方法相比, 所提控制方法的直径设定值跟踪和干扰抑制性能更好, 并且具有更好的动态跟踪和稳态性能. 另外, 在图12中, 当时滞阶次$d$发生变化时, 所提控制方法均能达到满意的晶体直径控制性能, 更好地显示了其具有更强的鲁棒性. 然而, 对于常规PID控制方法而言, 当时滞阶次d增大20 %时, 晶体直径控制难以较好地跟踪直径设定值, 始终存在较大的控制误差, 出现晶体直径控制效果抖振现象; 当时滞阶次d减小20 %时, 晶体直径跟踪控制能够逐渐收敛到直径设定值附近, 且受时滞阶次变化影响较小. 因此, 对于此类具有大滞后、慢时变动态特性的Cz法硅单晶生长过程, 常规PID控制难免有其局限性, 而所提控制方法具有明显的晶体直径控制优点, 即准确、稳定的在线控制性能.

    Cz法硅单晶生长过程的晶体直径控制一直是晶体生长领域研究的热点和难点. 针对这一问题, 本文提出了一种基于混合集成预测模型WPD-ELM-LSTM的晶体直径自适应NMPC方法. 通过基于互相关函数的时滞优化估计方法和基于Lipschitz商准则与模型拟合优度的模型阶次辨识方法, 准确的辨识了晶体直径模型结构, 并在“分而治之”原理下构建了数据驱动的晶体直径混合集成模型, 为晶体直径预测控制提供了精确的预测模型. 同时, 为了解决晶体直径混合集成模型失配问题以及目标函数难以求解问题, 采用ALO算法设计了晶体直径自适应NMPC求解策略. 基于实际硅单晶生长实验数据的晶体直径建模与控制仿真实验表明, 所提混合集成预测模型WPD-ELM-LSTM比常规ELM、LSTM、WPD-ELM和WPD-LSTM模型表现出更好的晶体直径预测性能和泛化能力. 另外, 基于混合集成模型的硅单晶直径自适应NMPC算法不仅可以实现晶体直径的精准控制, 而且能够有效抑制外部扰动和时滞变化的影响, 具有良好的控制性能以及工程应用前景.

  • 图  1  基于短文本情感增强的在线学习行为预测方法框架

    Fig.  1  Short-text sentiment enhanced achievement prediction method for online learners framework

    图  2  在线学习社区短文本表示模型

    Fig.  2  Sentiment classification model for online learning community short text

    图  3  学习状态建模与成绩预测过程

    Fig.  3  Learning state modeling and achievement prediction process framework

    图  4  不同特征对任务的贡献

    Fig.  4  Contribution of different features for tasks

    图  5  不同的m对任务的影响

    Fig.  5  Contribution of different m for tasks

    图  6  学习状态与成绩的关系

    Fig.  6  Relationship between learning status and achievement

    图  7  学习状态呈现正向变化的学习者占区间总学习者的比率(积极情感)

    Fig.  7  The ratio of learners who have a positive change in learning status to the total learner in the interval (positive emotions)

    表  1  不同类别课程的数量

    Table  1  Number of different types of courses

    课程类别 课程 合计课程数量数量 (门)
    工科 计算机科学, 电子工程 5
    理科 物理 2
    文科及其他 历史,体育 4
    下载: 导出CSV

    表  4  模型部分使用的特征

    Table  4  Part features used in the model

    特征类别 特征个数 部分特征
    统计特征 8+ 性别、年龄、教育层次、相关先行课成绩等
    学习行为特征 16+ 发帖次数、被回帖次数、观看教学视频时间、知识点测验成绩等
    下载: 导出CSV

    表  2  不同类别课程的人数及发帖数量

    Table  2  Number of people and post in different type courses

    课程类别 平均学习者人数 (人) 每个知识点下的发/回帖数量 (个)
    工科 2 326 3 200
    理科 2 681 1 520
    文科及其他 2 170 1 060
    下载: 导出CSV

    表  3  不同类别课程的情感类别分布

    Table  3  Distribution of sentiment categories in different type courses

    课程类别 情感类别分布 (约简为整数), 积极/消极/疑惑/正常情绪 (%)
    工科 16/14/37/33
    理科 21/19/27/33
    文科及其他 29/12/22/37
    下载: 导出CSV

    表  5  工程类课程的情感分类结果

    Table  5  Sentiment classification results of engineering courses

    方法 ACC RMSE
    Trigram 0.373 1.754
    TextFeature 0.415 1.789
    SSWE 0.353 1.976
    RNN + RNN 0.432 1.673
    Paragraph Vector 0.379 1.834
    DMGRNN 0.506 1.394
    HAN 0.532 1.281
    本文方法 0.573 1.185
    下载: 导出CSV

    表  7  文科及其他类课程的情感分类结果

    Table  7  Sentiment classification results of no-science courses

    方法 ACC RMSE
    Trigram 0.549 0.814
    TextFeature 0.562 0.811
    SSWE 0.568 0.864
    RNN + RNN 0.585 0.806
    Paragraph Vector 0.578 0.772
    DMGRNN 0.650 0.685
    HAN 0.677 0.633
    本文方法 0.706 0.584
    下载: 导出CSV

    表  6  理科类课程的情感分类结果

    Table  6  Sentiment classification results of science courses

    方法 ACC RMSE
    Trigram 0.543 0.822
    TextFeature 0.556 0.850
    SSWE 0.550 0.851
    RNN + RNN 0.580 0.786
    Paragraph Vector 0.556 0.821
    DMGRNN 0.644 0.696
    HAN 0.674 0.652
    本文方法 0.693 0.628
    下载: 导出CSV

    表  8  工科类课程的成绩预测结果

    Table  8  Achievements prediction results of engineering courses

    方法 Accuracy RMSE
    MR− 0.566 0.479
    MR+ 0.590 0.452
    MLP− 0.583 0.464
    MLP+ 0.603 0.437
    XGBoost− 0.679 0.335
    XGBoost+ 0.697 0.284
    FM 0.674 0.326
    LadFG 0.818 0.226
    SEAP 0.874 0.095
    下载: 导出CSV

    表  10  文科及其他类课程的成绩预测结果

    Table  10  Achievements prediction results of no-science courses

    方法 Accuracy RMSE
    MR− 0.648 0.409
    MR+ 0.664 0.336
    MLP− 0.652 0.340
    MLP+ 0.688 0.307
    XGBoost− 0.701 0.281
    XGBoost+ 0.743 0.269
    FM 0.726 0.222
    LadFG 0.874 0.154
    SEAP 0.924 0.051
    下载: 导出CSV

    表  9  理科类课程的成绩预测结果

    Table  9  Achievements prediction results of science courses

    方法 Accuracy RMSE
    MR− 0.598 0.430
    MR+ 0.612 0.419
    MLP− 0.618 0.408
    MLP+ 0.643 0.372
    XGBoost− 0.689 0.295
    XGBoost+ 0.709 0.278
    FM 0.687 0.295
    LadFG 0.803 0.203
    SEAP 0.902 0.084
    下载: 导出CSV
  • [1] Seaton D T, Bergner Y, Chuang I, Mitros P, Pritchard D E. Who does what in a massive open online course? Communications of the ACM, 2014, 44(4): 58−65
    [2] Kizilcec R F, Piech C, Schneider E. Deconstructing disengagement: Analyzing learner subpopulations in massive open online courses. In: Proceedings of the 3rd International Conference on Learning Analytics and Knowledge. Leuven, Belgium: ACM, 2013. 170−179
    [3] Fujita H. Neural-fuzzy with representative sets for prediction of student performance. Applied Intelligence, 2019, 49(1): 172−187 doi: 10.1007/s10489-018-1262-7
    [4] Guay F, Bureau J S. Motivation at school: Difierentiation between and within school subjects matters in the prediction of academic achievement. Contemporary Educational Psychology, 2018, 54(1): 42−54
    [5] Bergold S, Steinmayr R. Personality and intelligence interact in the prediction of academic achievement. Journal of Intelligence, 2018, 6(2): 27−27 doi: 10.3390/jintelligence6020027
    [6] Gardner J, Brooks C. Student success prediction in MOOCs. User Modeling and User-Adapted Interaction, 2018, 28(2): 127−203 doi: 10.1007/s11257-018-9203-z
    [7] Fujita H. Neural-fuzzy with representative sets for prediction of student performance. Applied Intelligence, 2019, 49(1): 172−187 doi: 10.1007/s10489-018-1262-7
    [8] Dalipi F, Imran A S, Kastrati Z. MOOC dropout prediction using machine learning techniques: Review and research challenges. In: Proceedings of the 2018 Global Engineering Education Conference. Albuquerque, USA: IEEE, 2018. 1007−1014
    [9] Conijn R, Van den Beemt A, Cuijpers P. Predicting student performance in a blended MOOC. Journal of Computer Assisted Learning, 2018, 34(5): 612−628
    [10] Corbett A T, Anderson J R. Knowledge tracing: Modeling the acquisition of procedural knowledge. User Modeling and User-Adapted Interaction, 1994, 4(4): 235−278
    [11] Piech C, Bassen J, Huang J, Ganguli S, Sahami M, Guibas L, Sohl-Dickstein J. Deep knowledge tracing. Computer Science, 2015, 3(3): 19−23
    [12] Zhang J N, Shi X J, King I, Yeung D Y. Dynamic key-value memory network for knowledge tracing. In: Proceedings of the 26th International Conference on World Wide Web Conferences, Perth, Western Australia: ACM, 2017. 765−774
    [13] Embretson S E, Reise S P. Item response theory for psychologists. Quality of Life Research, 2004, 13(3): 715−716 doi: 10.1023/B:QURE.0000021503.45367.f2
    [14] Torre J D L. DINA model and parameter estimation: A didactic. Journal of Educational and Behavioral Statistics, 2009, 34(1): 115−130
    [15] Liu Q, Wu R Z, Chen E H, Xu G D, Su Y, Chen Z G, Hu G P. Fuzzy cognitive diagnosis for modelling examinee performance. ACM Transactions on Intelligent Systems and Technology, 2018, 9(4): 1−26
    [16] Anderson A, Huttenlocher D, Kleinberg J, Leskovec J. Engaging with massive online courses. In: Proceedings of the 23rd International Conference on World Wide Web. New York, USA: ACM, 2014. 687−698
    [17] Ramesh A, Goldwasser D, Huang B, Daumé H, Getoor L. Learning latent engagement patterns of students in online courses. In: Proceedings of the 28th AAAI Conference on Artiflcial Intelligence. Québec, Canada: AAAI, 2014.1272−1278
    [18] Bayer J, Bydžovská H, Géryk J, Obšívač T, Popelínský L. Predicting drop-out from social behaviour students. In: Proceedings of the 4th International Conference on Educational Data Mining. Eindhoven, Netherlands: IEDM 2012. 103−109
    [19] Sweeney M, Rangwala H, Lester J, Johri A. Next-term student performance prediction: A recommender systems approach. In: Proceedings of the 8th International Conference on Educational Data Mining. Madrid, Spain: IEDM. 2016. 7−7
    [20] Ren Z, Xia N, Rangwala H. Grade prediction with temporal course-wise influence. arXiv:1709.05433, 2017.
    [21] Qiu J Z, Tang J, Liu T X, Gong J, Zhang C H, Zhang Q, Xue Y F. Modeling and predicting learning behavior in MOOCs. In: Proceedings of the 2016 ACM International Conference on Web Search and Data Mining. San Francisco, USA: ACM, 2016. 93−102
    [22] Yang H, Cheung L P. Implicit heterogeneous features embedding in deep knowledge tracing. Cognitive Computation, 2018, 10(1): 3−14 doi: 10.1007/s12559-017-9522-0
    [23] Zhang L, Xiong X L, Zhao S Y, Botelho A F, Heffernan N T. Incorporating rich features into deep knowledge tracing. In: Proceedings of the 4th ACM Conference on Learning Scale. Cambridge, USA: ACM, 2017. 169−172
    [24] Huang Y. Deeper knowledge tracing by modeling skill application context for better personalized learning. In: Proceedings of the 2016 Conference on User Modeling Adaptation and Personalization. Halifax, Canada: ACM, 2016. 325−328
    [25] Su Y, Liu Q W, Liu Q, Huang Z Y, Yin Y, Chen E H, Ding C, Wei S, Hu G P. Exercise-enhanced sequential modeling for student performance prediction. In: Proceedings of the 32nd AAAI Conference on Artiflcial Intelligence. New Orleans, USA: AAAI, 2018. 2435−2443
    [26] Feng W Z, Tang J, Liu T X. Understanding dropouts in MOOCs. In: Proceedings of the 32nd AAAI Conference on Artiflcial Intelligence, Hawaii, USA: AAAI, 2019.
    [27] Wen M M, Yang D Y, Rosé C P. Sentiment analysis in MOOC discussion forums: What does it tell us? In: Proceedings of the 6th International Conference on Educational Data Mining. London, UK: IEDM, 2014. 130−138
    [28] Tucker C, Pursel B K, Divinsky A. Mining studentgenerated textual data in MOOCs and quantifying their effects on student performance and learning outcomes. The ASEE Computers in Education Journal, 2014, 5(4): 84−84
    [29] Chaplot D S, Rhim E, Kim J. Predicting student attrition in MOOCs using sentiment analysis and neural networks. In: Proceedings of the 2015 Workshops at the 17th International Conference on Artiflcial Intelligence in Education. Madrid, Spain: CEUR-WS.org, 2015. 7−12
    [30] 冯冲, 康丽琪, 石戈, 黄河燕. 融合对抗学习的因果关系抽取. 自动化学报, 2018, 44(5): 811−818

    Feng Chong, Kang Li-Qi, Shi Ge, Huang He-Yan. Causality extraction with GAN. Acta Automatica Sinica, 2018, 44(5): 811−818
    [31] 郝洺, 徐博, 殷绪成, 王方圆. 基于n-gram频率的语种识别改进方法. 自动化学报, 2018, 44(3): 453−460

    Hao Ming, Xu Bo, Yin Xu-Cheng, Wang Fang-Yuan. Improve language identiflflcation method by means of n-gram frequency. Acta Automatica Sinica, 2018, 44(3): 453−460
    [32] 侯丽微, 胡珀, 曹雯琳. 主题关键词信息融合的中文生成式自动摘要研究. 自动化学报, 2019, 45(3): 530−539

    Hou Li-Wei, Hu Po, Cao Wen-Lin. Automatic Chinese abstractive summarization with topical keywords fusion. Acta Automatica Sinica, 2019, 45(3): 530−539
    [33] Wu Z, Dai X Y, Yin C Y, Huang S J, Chen J J. Improving review representations with user attention and product attention for sentiment classiflcation. In: Proceedings of the 32nd AAAI Conference on Artiflcial Intelligence. New Orleans, USA: AAAI, 2018. 5989−5996
    [34] Pennington J, Socher R, Manning C. Glove: Global vectors for word representation. In: Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Doha, Qatar: ACL, 2014: 1532−1543
    [35] Ramesh A, Kumar S H, Foulds J, Getoor L. Weakly supervised models of aspect-sentiment for online course discussion forums. In: Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing. Beijing, China: ACL, 2015. 74−83
    [36] Fan R E, Chang K W, Hsieh C J, Wang X R, Lin C J. LIBLINEAR: A library for large linear classiflcation. Journal of Machine Learning Research, 2008, 9(9): 1871−1874
    [37] Kiritchenko S, Zhu X D, Mohammad S M. Sentiment analysis of short informal text. Journal of Artiflcial Intelligence Research, 2014, 50(1): 723−762
    [38] Socher R, Perelygin A, Wu J Y, Chuang J, Manning C D, Ng A, Potts C. Recursive deep models for semantic compositionality over a sentiment treebank. In: Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing. Seattle, USA: ACL, 2013. 1631−1642
    [39] Le Q V, Mikolov T. Distributed representations of sentences and documents. In: Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing. Seattle, USA: ACL. 2013: 1631−1642
    [40] Tang D Y, Qin B, Liu T. Document modeling with gated recurrent neural network for sentiment classiflcation. In: Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. Lisbon, Portuga: ACL. 2015: 1422−1432
    [41] Yang Z C, Yang D Y, Dyer C, He X D, Smola A, Hovy E. Hierarchical attention networks for document classiflcation. In: Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. San Diego, USA: ACL, 2016: 1480−1489
  • 期刊类型引用(7)

    1. 詹兆康,胡旭光,赵浩然,张思琪,张峻凯,马大中. 基于多变量时空融合网络的风机数据缺失值插补研究. 自动化学报. 2024(06): 1171-1184 . 本站查看
    2. 马大中,王天彪,胡旭光,刘羽洋,刘金海. 基于数据驱动的管道云边协同泄漏检测方法. 控制与决策. 2023(08): 2415-2424 . 百度学术
    3. 王睿,孙秋野,张化光. 微电网的电流均衡/电压恢复自适应动态规划策略研究. 自动化学报. 2022(02): 479-491 . 本站查看
    4. 刘金海,赵真,付明芮,左逢源,王雷. 基于主动小样本学习的管道焊缝缺陷检测方法. 仪器仪表学报. 2022(11): 252-261 . 百度学术
    5. 孙秋野,王一帆,杨凌霄,张化光. 比特驱动的瓦特变革——信息能源系统研究综述. 自动化学报. 2021(01): 50-63 . 本站查看
    6. 熊珞琳,毛帅,唐漾,孟科,董朝阳,钱锋. 基于强化学习的综合能源系统管理综述. 自动化学报. 2021(10): 2321-2340 . 本站查看
    7. 张化光,孙宏斌,刘德荣,王剑辉,孙秋野. “分布式信息能源系统”专题特约主编寄语. 中国电机工程学报. 2020(17): 5401-5403 . 百度学术

    其他类型引用(3)

  • 加载中
图(7) / 表(10)
计量
  • 文章访问数:  1831
  • HTML全文浏览量:  215
  • PDF下载量:  240
  • 被引次数: 10
出版历程
  • 收稿日期:  2019-01-03
  • 录用日期:  2019-07-10
  • 网络出版日期:  2020-09-28
  • 刊出日期:  2020-09-28

目录

/

返回文章
返回