NNIT Detail Lifesciences (3)Umbraco
数据与人工智能

利用算法对利奥制药的 18,000 份文档进行整理

​NNIT 和利奥制药携手合作,利用机器学习、自动化和共同创造,开创了新的方法来保障数千份关键业务文档排列有序,结构良好。该项目预计将释放价值数千万丹麦克朗的资源。


文档管理是生命科学行业面临的普遍挑战。大多数制药公司将数千份文档存储在 Veeva Vault 等平台。其中包括对药品生产至关重要的作业指导书和标准操作程序 (SOP)。若要避免重复文档、测试稿和长期被遗忘的草稿(有些只有不到 100 个字符)混入有效文档当中,制药公司需要投入大量资源来维护文档的合规性。

为了革新文档管理实践和进行优化清理,利奥制药与 NNIT 合作,采取开创性的方法来应对挑战:使用人工智能来协助管理文档,使其对用户更加友好。

保守估计,整个项目预计将释放价值数千万丹麦克朗的资源,并将这些资源用于更有成效的任务。该举措也是旨在为优化内部流程铺平道路,并为文件管理提供整体上更加数据驱动化的方式。

50 年的清理
根据利奥制药的估算,单人人工人工逐一核查清理近 18,000 份文档需要耗时近 50 年,于是他们产生了使用人工智能的想法。

– 我们很快意识到手动清理耗时太久。仅仅是记录我们已经清理过哪些文档便是一项艰巨挑战。利奥制药质量系统和业务流程管理项目经理约瑟芬·海德胡斯 (Josefine Hedehus) 表示,为了使流程更易于管理,我们决定探索使用人工智能的可能性,借助算法来帮助整理文档。

她和同事托本·克拉纳 (Torben Craner) 一起领导了清理项目,该项目涵盖利奥制药的全球机构,涉及许多利益相关者,尤其是产生大量文档的业务领域。

在整个项目中共同创造
作为清理过程的一部分,利奥制药希望调整文档的组织方式,以便将内容归类到相关子类别中。因此,他们需要的合作伙伴不仅要熟悉人工智能和 Veeva,而且要了解生命科学机构的工作流程和监管要求。

– 除了拥有丰富的 Veeva 使用经验外,NNIT 还深悉文档管理工作,并对 GxP 有深入的了解。从一开始,该项目就具有良好的氛围和动力。NNIT 团队善于提出明确的问题,以便能够正确校准分类。托本·克拉纳表示,在整个过程中,他们提出了我们从未考虑过的想法和观点,共同创造贯穿始终,取得了超出所有人预期的成果。

人机协同工作
基于预期的初始匹配,NNIT 设计了一个基于Amazon Web Services (AWS)技术的智能数据质量解决方案,该解决方案使用自然语言处理 (NLP)。这意味着人工智能算法不仅可以识别单个单词,还能基于上下文和自然语言对文本进行解读分析,因此可以扫描文档并直接从文本中提取结构化内容。

算法排序的结果显示在对用户友好的人工智能培训应用程序中,来自利奥制药的主题专家 (SME) 可以在该应用程序中审查和鉴定文档。用户可以直接与算法进行通信,并且能够改进算法,使其更加精准。文档被正确分类后,文档整理便可以进一步自动化。

将算法与人类用户和自动化相结合可以取得很好的效果,这是一项重要的经验。原始数据不能单独存在。例如,大部分内容是针对利奥制药的,其主题专家需要理解、确认这些内容。我们举办了一系列研讨会,回顾了大致的分类,在专家们的第一轮处理后,约 90% 的内容得到了正确的分类。

提高培训文档的质量
在利奥制药的其他业务领域,也能感受到新文档管理流程的积极作用,例如培训文档的质量。

– 培训是 GxP 的重要组成部分。约瑟芬·克雷默·海德胡斯 (Josefine Cramer Hedehus) 表示,通过部署更有条理的清理流程,我们可以确保培训文档的质量得到改善,这将提高培训中阅读和理解培训的质量。

经过共 20 周的启动和部署,该解决方案现已作为整体数据报告的一部分移交给利奥制药,用于进一步清理和重组文档。

Hybrid cloud, Algorithm infographic

利奥制药的智能数据质量解决方案由 AWS 的各种服务组成,包括 AWS Textract、亚马逊简易存储服务 (S3) 和 AWS Comprehend Medical,并在 AWS 的云基础架构上托管。

网站联系方式2 画板 1 (1)