人工智能生成内容(AIGC)的迅速崛起,正在重塑中国乃至全球的数字经济格局。在生成模型、自然语言处理和深度学习等人工智能技术取得突破的推动下,AIGC正在彻底变革内容的生产与消费方式。
在中国,得益于政府与私营部门的共同努力,人工智能和移动互联网以前所未有的速度蓬勃发展。根据中国信息通信研究院的一份报告,到今年年底,中国数字经济市场价值很可能超过60万亿元人民币。在一定程度上,人工智能和移动互联网的发展推动了这一增长。
处于这场变革前沿的中国科技巨头,如百度、阿里巴巴和腾讯,正在大力投资人工智能内容生成应用,这些应用广泛用于电子商务、媒体和教育等行业。市场营销、娱乐和客户服务等领域对自动化内容创作的需求日益增长,推动了这一行业的快速发展。然而,这种增长也带来了诸多挑战,尤其是在内容真实性、知识产权以及建立健全监管框架以解决这些问题等方面。
AIGC发展过程中面临的一个关键挑战,在于这些系统所依赖的数据质量。尽管AIGC背后的算法和计算能力令人瞩目,但这些系统的有效性归根结底取决于其处理的数据。因此,数据质量管理(DQM)变得至关重要。低质量的数据可能会导致不准确的结果,这在医疗保健和社会服务等敏感行业中尤为棘手。一个典型案例凸显了低质量数据的危害,即谷歌的流感趋势模型。2013年2月,由于数据问题,该模型预测的流感样疾病就诊比例,比官方估计值高出一倍多。
AIGC的数据质量问题不容忽视。人工智能系统有时会生成 “幻觉内容”,即虚假或编造的内容,这引发了人们对错误信息的担忧。OpenAI在2023 年发布的一份报告显示,其人工智能文本检测器能够正确识别出26%的人工智能生成文本为 “可能由人工智能撰写”。
此外,德勤2024年的报告强调,超过50%的组织表示,在其环境、社会和治理(ESG)报告的数据质量方面面临重大挑战。这可能会影响决策所依据数据的可靠性,并可能导致错误信息和假新闻传播等问题。
应对这些挑战对于充分发挥AIGC的潜力至关重要。DQM的重要性怎么强调都不为过。在中国快速增长的数字经济中,DQM的作用是培养对AIGC技术信任的关键。高质量的数据为可靠的见解和更好的决策奠定了基础,这对于各个行业采用AIGC至关重要。