Optical Fiber B

生命科学行业应用人工智能AI合规验证探讨

人工智能与机器学习


ChatGPT的惊艳表现使人工智能在全世界成为热点。人工智能这个概念诞生已久,能够通过图灵测试的ChatGPT给大家带来了很多惊喜,但它的功能远不止如此,似乎已经距离大规模商用仅一步之遥。

图灵测试最早见于阿兰·图灵于1950年发表的论文《计算机器与智能》中,定义是如果计算机系统模型能够在5分钟内回答由人类测试者提出的系列问题,且其超过30%的回答让测试者误认为是人类所答,则该模型通过图灵测试。

从表面上看,要使机器回答人类提出的问题似乎不难,可以通过特殊的程序来实现。然而,如果提问者并不遵循常规标准或并不按部就班,编制回答程序将变得不可能。例如以下人类和计算机系统的对话场景:

 

对话A

问:你会写文章吗?

答:是的。

问:你会写文章吗?

答:是的。

问:请再次回答,你会写文章吗?

答:是的。

出现以上的答案,那么可以确认面前的这位是非智能系统。

 

对话B

问:你会写文章吗?

答:是的。

问:你会写文章吗?

答:是的,我不是已经回答了吗?

问:请再次回答,你会写文章吗?

答:很烦,为什么一直提同样的问题。

那么,很容易判断与之对话的将不可能是计算机。

 

上述两种对话的区别在于,第一种可明显地感到回答者是拥有标准的唯一答案,第二种则具有场景的分析能力,而且回答者知道它面对的是同样的问题。“图灵测试”没有规定问题的范围和提问的标准,可想而知能通过图灵测试的计算机系统有多么强大。

图灵测试旨在提供令人满意的智能操作定义,如果机器具有以下功能则可以认为通过了图灵测试:

► 通过理解和编写自然语言与人交往

► 知识表示(知道如何向用户呈现知识)

► 知识推理(知道如何从存储的知识推断回答以回答人类)

► 机器学习推断模式并适应新的环境

 

简而言之,AI就是研究有助于构建智能机器的规则和算法。

机器学习是人工智能的一个子集,它通过算法从数据中学习获得一些人类需要的数据。同样,机器的学习能力使其足够强大以适应新的环境。任何机器学习算法的目标都是通过学习过程使其目标最大化,以便它能够处理看不见的数据。

实现机器学习的两个关键学习方法(算法)是:

监督学习 - 外部设计者或标记数据有助于机器学习

无监督学习 - 机器学习时没有任何标签数据或外部设计者

 

生命科学行业中AI的合规验证探究


关于控制设计 (Control Design)

AI是架构在计算机技术上,而应用AI的核心意义在于对输入和输出的控制,在控制的设计阶段,针对AI系统的功能边界,定义了控制设计的5个阶段,可以把它理解为对AI系统的功能层面的划分:

第一阶段:系统与常规GxP流程并行使用。

第二阶段:系统与常规GxP流程并行使用,但系统自动执行GxP流程,必须由操作员主动批准。

第三阶段:系统自动执行流程,但可由操作员修改。

第四阶段:系统自动运行并自行控制。

第五阶段:系统自动运行并自行校正。

 

关于自主性 (Autonomy)

AI与传统的计算机系统或自动化系统的区别,便是其对自主性的理解,AI能够自动根据参数捕捉数据,然后通过学习模型自主完成输出,输出类型最常见的是控制动作指令,而成熟的AI在整个过程中无需人类的介入:

 

人工智能AI的验证成熟度模型

Nico Erdmann博士等人针对AI在生命科学行业的应用现状,基于对合规的理解,制作了控制设计和自主性的验证成熟度模型矩阵,通过此矩阵能够很好的定义AI的横向/纵向边界,匹配适宜的验证活动,满足生命科学行业的监管要求。成熟度模型矩阵如下:

同时,针对不同的验证级别,规定所需的最小验证活动,见下表:

对于完全具备机器学习功能的AI,当前技术上处于突破期,未能有充足且成熟的案例用以开发其验证活动的研究。

总之,在运行期间,为了确保日益自主的人工智能系统的技术,控制人工智能系统的组织负担(在框架的较低级别更为明显)与增加验证活动,二者之间要求权衡。所以最重要的是:必须决定在操作过程中应嵌入多少人为控制。

 

AI系统的验证动态路径展示

公司决定探索人工智能系统在特定场景中的可用性,与现有的 GxP流程关联(AI 验证级别 I)
成功引入AI系统后,AI系统应接管GxP过程,同时仍处于锁定操作模式状态并对所有实例进行控制(AI验证级别III);同时,引入了更严格的技术和功能验证活动
进一步扩展AI系统的附加值,控制设计更改为并非所有实例都受到控制的模式;由于它仍在锁定状态模式下运行,因此适用 AI 验证级别 III。但是,鉴于 GxP 过程的重要性,可能会引入进一步的控制措施
在收集有关AI系统的特定用例的足够经验后,自主性的增加以便系统可以指示必要的再培训(AI验证级别IV)
进一步扩展系统的自主性,训练过程更面向AI系统的机制,即执行再训练的方式,但这种新版本的激活仍然由人类操作员验证(仍然是AI验证级别IV)
作为解决方案成长路径的最后一步,选择控制阶段 4,以便系统控制自身(AI 验证级别 V)

注:

本文部分内容引自ISPE月刊:《AI Maturity Model for GxP Application: A Foundation for AI Validation》;Nico Erdmann, PhD ; Rolf Blumenthal ; Ingo Baumann ; Markus Kaufmann.

 

特邀作者

汪江维 / Jiangwei Wang

NNIT 资深CSV专家

超过10年生命科学行业从业经验,拥有多次生命科学行业NMPA, cGMP过审经验,曾担任第三方机构的GMP审核官,参与地方药监系统的“飞检”等活动。目前专注于生命科学行业数字化系统(EQMS)的实施、部署和上线。