【北京,2026年6月】 友虹(北京)科技有限公司正式发布"OFD非结构化文件结构化语义标注标引平台",标志着电子文件智能化处理领域取得重大突破。该平台能够有效解决非结构化文件难以被机器理解和利用的行业痛点,实现文件内容的语义化、结构化转换,让非结构化文件真正做到"机可读、人可读"。

图:OFD非结构化文件结构化语义标注标引平台管理界面

随着数字化转型的深入,海量电子文件以非结构化形式存储,机器难以自动理解和处理,成为制约人工智能应用的重要瓶颈。友虹科技基于OFD国家标准格式,结合先进的语义分析技术,打造了这款兼具结构化标注与语义标引能力的创新平台。

友虹科技在该平台中提供了核心的OFD技术支撑。作为国内领先的OFD版式文档技术提供商,友虹科技将OFD格式的长期保存、安全可控、精确呈现等特性与语义标注技术深度融合,确保结构化后的文件在机器可读的同时,依然保持原有版式完整性和视觉一致性。平台支持将非结构化文件的语义进行正向与反向结构化处理,并能够输出为大模型训练所需的XML格式数据,真正实现从电子文件到AI可用数据的桥梁作用。

该平台具备多项核心优势:支持OFD国家标准格式,确保文件符合规范要求;语义双向结构化,既能从非结构化到结构化,也能反向校验一致性;大模型友好输出,原生支持XML格式导出,无缝对接AI训练流程;自主可控安全可靠,基于国产OFD技术,保障数据安全。

图:平台对病案文书进行AI语义标注的实际应用效果展示

业内专家指出,高质量数据集是人工智能发展的基石,而海量电子文件的结构化处理是实现数据价值化的关键一步。友虹科技此次发布的标注标引平台,不仅能够大幅降低AI数据集的建设成本,更为政府机关、交通基础设施、企业档案、医疗病案等领域的智能化升级提供了坚实技术基础。

友虹(北京)科技有限公司专注OFD版式文档技术研发与应用,是国内领先的电子档案解决方案提供商,致力于推动电子文件管理的标准化、规范化与智能化。