JAFC | 北京工商大学联合农科院蜜蜂所发表食品黄酮涩味预测最新研究
Journal of Agricultural and Food Chemistry
●1.1背景
涩味作为一种重要的风味感知,普遍存在于茶、葡萄酒、可可、菠菜等食物中。从涩味类型来看,天鹅绒般的涩味可被认为是一种积极的感觉,而皱缩的涩味则是一种相对消极的感觉,因此,二者在食品感官贡献和消费者喜好方面存在较大差异。由于食物体系的复杂性,其关键涩味成分的识别对食物感官品质改良是一项重大挑战。近年来,分子感官科学和高精密分析仪器的快速发展,发现食物的涩味绝大部分是来自于黄酮类化合物。然而,自然界中的黄酮类化合物有成千上万种衍生物,这导致若仅通过实验方法来评价这些黄酮类化合物的涩味,在人力、时间和金钱上都是非常昂贵的。有趣的是,这类化合物是由C6-C3-C6为骨架组成的,并且它们的骨架相似性非常高,这使得从构效角度出发来加快黄酮涩味的识别是一种可行方案。随着计算机科学与食品科学的交叉发展,基于分子结构信息的机器学习方法将加速这一过程,不仅可以用来挖掘黄酮结构与涩味之间的构效关系,还可以结合组学技术提前发现食品中潜在的关键涩味分子。
1.2 目的或结论概要
近日,北京工商大学郭天洋副教授、赵磊教授、宋焕禄教授联合农科院蜜蜂所潘飞等人在《Journal of Agricultural and Food Chemistry》发表题为“FAPD: An Astringency Threshold and Astringency Type Prediction Database for Flavonoid Compounds Based on Machine Learning”的Supplementary Cover文章,该研究首次在食品黄酮涩味识别中引入机器学习方法,并且基于监督学习预测模型和无监督学习天然产物结构聚类模型研究黄酮结构与涩味之间的关系和构建超过1200种黄酮涩味预测数据库(FAPD)。郭天洋副教授和农科院蜜蜂所22级博士生潘飞为该论文的共同第一作者,郭天洋副教授和赵磊教授为该论文共同通讯作者。
● (点击页面左下角阅读原文,直达文献页面)
成果介绍
首先,该篇文章收集了十余年上百种经实验确定的涩味黄酮类化合物及其涩味阈值和涩味类型数据,后经筛选确定其中64种黄酮物质可用于建模分析。
(1)使用层次聚类算法分别对黄酮类化合物的分子指纹相似性(MFSs)和涩味阈值进行聚类,结果发现分子指纹结构相似度与涩味阈值具有正相关,而高阈值与低阈值的黄酮类化合物之间的分子指纹相似性较低;进一步使用高斯过程回归(GPR)、支持向量回归(SVR)、随机森林(RF)和梯度增强决策树(GBDT)四种机器学习模型对黄酮结构性质参数与涩味阈值进行QSAR建模,其中RF算法在训练集和测试集的拟合效果都表现最好,其R2均高于0.88,并且MSE和RMSE值均低于其他三种模型;使用可解释性机器学习框架SHAP工具对RF模型进行分析,发现PEOE_VSA8和BCUT2D_MWLOW两个描述符对涩味预测贡献度最高。
(2)涩味类型分为天鹅绒般和皱缩,二者的预测可以使用二分类算法来完成。在所使用的六种机器学习模型中,RF和SGD模型经3折和5折交叉验证的准确率均超过96%,优于其余四种模型,而SGD模型在3倍交叉验证下的表现比5倍交叉验证下的表现更好;在3倍交叉验证的SGD和RF模型中,皱缩涩味类型和天鹅绒般涩味类型的识别精度、召回率和f1得分都高于94%,SGD模型的准确性优于RF模型和其余四种模型。
(3)如何利用预测模型发现新型天然的涩味化合物是促进食物感官品质改良的一个主要障碍。为了快速获取结构相似的天然类黄酮化合物,并通过预测其潜在的涩味来指导食品质量控制,本研究先开发并建立了天然产物聚类库(NPCL)工具(发明专利:ZL 202211066439.5),富集了1279种与建模数据集高度相似的天然黄酮类化合物,之后结合最佳的RF-QSAR模型和融合三种SGD分类模型进行预测并构建黄酮涩味预测数据库(FAPD)。该数据库中有423种和超过800多种黄酮类化合物分别被标记为皱缩和天鹅绒般涩味,并且约87.8%黄酮类化合物的涩味阈值低于100 μM。
(4)进一步采用t-SNE算法对真实涩味类型的黄酮类化合物和1279种预测涩味类型的黄酮类化合物进行降维可视化分析,结果表明预测结果与真实结果具有很好的重叠,这验证基于SGD分类模型是有效的。综上所述,采用机器学习模型能较好地预测黄酮类化合物的涩味阈值和涩味类型。这些模型将为加快计算Dot提供丰富的涩味阈值数据支持,而无需分离和提纯,并为食品整体涩味感官偏好评价提供阈值类型信息。此外,该研究方法可应用于其他食物的风味研究,以及持续关注的分子结构与风味性质的关系以解码食品中的风味奥秘。
图1. 基于无监督学习的类黄酮类化合物聚类结果(A) ECFP4分子指纹相似性和(B)涩味阈值
图2. 基于四种机器学习算法开发的QSAR预测模型 (A) GPR, (B) SVR, (C) GBDT and (D) RF
图3. 基于NPCL的天然类黄酮化合物涩味收敛性预测结果.
资助情况
国家自然科学基金(No. 32102120、No.32172335)、学科建设-食品科学与工程(No. SPKX-202201)。
参考文献
https://doi.org/10.1021/acs.jafc.2c08822
文章来源:食品加 智食科技
转载平台:食品加 智食科技
责任编辑:胡静
审核人:何发
食品加 智食科技
展源
何发
2024-09-04
2024-10-15
2024-10-29
2024-10-17
2024-09-02
2024-10-22
2024-09-24
实验室是科技创新的基础条件和成果产出源泉。十四五以来,国家着力打造战略科技力量,推进国家实验室建设和国家重点实验室体系重组,数字化、智能化、自动化赋能生物科技快速发展,掀起了科研领域创新变革的浪潮。
作者:展源
评论
加载更多