gis

Views:
 
Category: Education
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

地理信息-标准与质量控制 :

地理信息-标准与质量控制 中国 GIS 协会 标准与质量控制专业委员会2004.11.14于北京

地理信息-标准与质量:

地理信息-标准与质量 地理信息标准的现状与问题 现存有关国家及行业标准 相关的研究 组织机构 国际上与 GIS 有关的主要标准化活动 问题 地理空间数据质量的现状与问题 重要性 现状 相关标准 问题

现存有关国家及行业标准:

现存有关国家及行业标准 自1980年至2003年国内已制定近70项国家及行业标准,主要类型: 术语 分类与编码 交换格式 质量要求 元数据 空间信息表达 一致性测试 设计规范 现存有关国家及行业标准

有关标准的研究:

有关标准的研究 1984:国家科委组织完成了《资源与环境信息系统国家规范报告》 七五:国家科委新技术局组织:对地理空间坐标系统、资源与环境信息数据分类方案、地理空间数据编码体系、地理空间数据交换格式等问题进行深入研究,提出20多种标准建议方案 八五、九五期间:国家科委组织:《城市地理信息系统标准化指南》 十五: 国家科技部 国家发改委 各部委:国土资源部、国家测绘局、水利部、铁道部、建设部、交通部、农业部、环保局、地震局、气象局

相关组织:

相关组织 1994 GIS 协会成立了标准化与质量控制专业委员会 1997年经国家技术监督局批准成立了全国地理信息标准化技术委员会

与地理信息有关的主要标准化活动:

与地理信息有关的主要标准化活动 ISO: 40多个项目 已发布国际标准: OGC 已完成:17+12 正在制定:30

存在问题:

存在问题 缺乏地理信息标准体系框架 结构化标准体系 缺乏总体指导标准 缺乏基础性、通用性的标准 标准的制定百花齐放,各自为政,缺乏协调 采用国际标准问题:结合实际,抓主重点

地理信息-质量:

地理信息-质量 质量的重要性 质量研究与实践的现状与特点 空间数据质量标准 存在问题

数据质量的重要性:

数据质量的重要性 数据是一种战略资源与生产要素,已经成为现代社会正常运转的基础,成为企业的生命线 事实: 599 个被调查公司中的 75 %都存在由于数据质量问题造成经济损失的现象。只有 35 %的公司相信自己的数据, 15 %的公司相信合作伙伴的数据( Elizabeth M. Pierce, 2003 )。 据数据仓库研究所( TDWI ) 2002 年的一项研究报告估计,在美国,每年因数据质量耗费约 6000 亿美元 。 笔者在一项培训资料上看到,在数据质量方面的花费占企业总销售或年收入的 10 - 20 %; A. T. Kearney 的 CEO 认为,服务业高达 25 - 40 %的费用与数据质量有关。 结论:数据质量的问题是普遍的,耗费的资金是巨大的。数据质量的问题已开始成为管理的核心,成为质量管理体系研究的热点,正在引起越来越广泛的关注

数据质量研究与实践的现状:

数据质量研究与实践的现状 由于数据质量对决策正确性的重大影响,政府部门积极制定法规保障数据质量 提出了广义数据质量的概念 数据质量的描述框架 将数据作为产品,采用管理产品质量的方法管理数据质量 开发了成套的与数据质量有关的方法与工具 开展数据质量的教育、培训与咨询 初步形成了地理信息数据质量的系列国际标准

政府部门制定法规保障数据质量:

政府部门制定法规保障数据质量 2001 年,根据发展的需要,美国国会决定由美国总统事务办公厅管理和预算办公室发布政府信息质量指南以最大限度的保证联邦机构所发布信息的质量,并要求每个联邦机构在 2002 年 10 月 1 日前,结合本部门实际发布信息质量指南,建立管理机制使得数据的使用者能够发现并得到联邦机构所维护与传播的正确信息,同时要定期向主管报告。包括美国国防部、能源部、农业部、内政部等 40 多个部(包括二级机构如内政部所属美国地调所 USGS 等),其他执行机构及委任的独立管理机构共计 64 个部门发布了自己的信息质量指南。

广义数据质量的概念:

广义数据质量的概念 传统的数据质量概念:主要指在数据生产过程中形成的 “ 质量 ” ,如精度、一致性、完整性等,也称本征质量。 广义数据质量:随着数据资源的积累与广泛应用,数据质量的概念有所扩展。对用户要求的满意程度成为衡量数据质量的重要指标。在这种意义上,数据质量可以说是满足使用要求的相对状态。这就是广义数据质量, 要点:从用户或数据共享的角度出发描述数据质量。除本征质量外,可得性、满足用户要求的程度、表达的是否清晰易懂以及动态质量等成为衡量数据质量的重要方面

数据质量的描述框架:

数据质量的描述框架 描述框架是数据质量的基本问题:解决从哪些方面描述数据质量 建立反映领域特点的数据质量框架,是数据质量评价首先要解决的问题 数据质量的描述可分为不同层次 不同领域对数据质量的描述也不同

数据质量的描述框架(续):

数据质量的描述框架(续) l 几种数据质量描述的框架: 联邦政府对联邦机构向公众传播的数据质量描述框架:实用性、客观性(准确、可靠、清晰、完整、无歧义)、安全性 国际金融基金会统计部经研究提出的数据质量描述框架( Carol S. Carson , 2000 ): 包括产品质量与制度质量两大方面。分为 5 个域进行描述:完整性、概念一致性、准确度、服务性及可访问性。每个域再细分为若干元素及指示元素 MIT 的研究将数据质量描述分为 4 个大类,每类中再分解成若干域 美国国防部在其数据质量指南中提出的数据质量描述框架为:准确度、完整性、一致性、现势性、主键唯一性及值域的有效性( DOD Guidelines,2004); ISO 19113 提出的地理信息质量描述框架:分为定量数据质量与非定量数据质量

MIT的数据质量描述框架:

MIT 的数据质量描述框架 类 描述 包含的域 本征质量 固有的质量 可信度、准确度、客观性、信誉 与应用有关的质量 与具体任务的环境有关的数据质量 增值、关联、适时、完整、合适的数据量 表达方面的质量 计算机系统存储与表达信息的质量 可解释性、易懂性、一致性、简明性 可访问性方面的质量 强调计算机系统必须可访问,但要安全 可访问性与访问的安全性

将数据作为产品,采用管理产品质量 的方法管理数据质量:

将数据作为产品,采用管理产品质量 的方法管理数据质量 将数据作为产品进行管理,这是 MIT 数据质量研究项目的一项重要研究结论。是借用管理产品质量的方法管理数据质量的前提或基础 MIT 数据质量项目的负责人 Wang 教授等人认为将数据作为产品,应遵循下述4条原则 理解客户的信息需求 将信息作为具有明确定义的生产过程的产品进行管理 将数据作为具有生命周期的产品进行管理 设置数据产品管理员管理数据生产过程与结果 采用全面质量管理的方法管理数据质量在发达国家已经成为明显趋势

成套的与数据质量有关的方法与工具:

成套的与数据质量有关的方法与工具 解决数据重复、缺失及无效记录等问题的清理工具; 数据质量调查、分析与评价工具:评价与分析,包括完整性分析等 IPMap : 这是一种描述与评价数据产品是如何生产出来的图形工具 。 它的基础是数据流程图,但包括更多的符号和元数据对与数据产品的生产有关的细节进行描述。 IPMap 有助于对数据产品生产过程重要阶段的可视化,便于确定瓶颈、确定所属关系及解决问题。 数据质量问题根本原因的分析

开展数据质量的教育、培训与咨询:

开展数据质量的教育、培训与咨询 大学设置了有关数据质量管理的课程并提供短期培训 已涌现出一批公司如 Acxiom 、 Ascential 、 Evike 、 Firstligic 、 Group1 等采用不同的技术如 ETL ( Extraction 、 Transform 、 Load ), 名称匹配、去污以及整形、业务规则抽取、客户识别系统等提供数据质量及咨询服务 借国际会议之机,举办各种研讨班进行数据质量培训已成为一种惯例 培训的主要内容包括数据质量政策与标准、原理和基础、全面数据质量管理、数据质量管理与评价的方法与工具(包括软件工具)、数据质量问题的解决方案、实例等

形成了地理信息数据质量的系列国际标准:

形成了地理信息数据质量的系列国际标准 与数据质量有关的国际标准共有 4 个: ISO 19113 地理信息 质量规则 ISO 19114 地理信息 质量评价过程 ISO 19138 地理信息 数据质量的量度 ISO 19115 地理信息 元数据 前两个已经发布为国际标准, ISO 19138 正在制定。上述 3 个标准基本上构成了空间数据质量的系列标准。 ISO 19115 地理信息 元数据中描述数据质量的有关内容只是整个标准的一小部分

地理信息数据质量国际标准的要点:

地理信息数据质量国际标准的要点 ISO 19113 的要点: 描述数据质量的元素(元素及子元素)。分为两类:一类是定量的质量信息、一类是非定量的质量信息 (见表) 标准的应用:用于指导确定具体数据集数据质量元素,选择与扩展 数据质量报告 ISO 19114 的要点 数据质量评价过程(见图) 评价方法 质量报告格式

地理信息数据质量国际标准的要点(续):

地理信息数据质量国际标准的要点(续) ISO 19138 的内容要点 该标准的目的是规范空间数据的量度,使得数据质量更具可比性,便于用户对不同来源的数据进行对比,确定哪些数据适合自己的应用 提供数据质量度量的基本集合,如错误个数、错误率、误差均值、最大误差、标准偏差、布尔值。同一个数据质量元素可使用不同的度量。 最终的确定取决于数据的类型和预期目的;

地理信息数据质量国际标准的相互关系:

地理信息数据质量国际标准的相互关系 上述系列标准对数据质量的描述、度量、评价以及质量评价结果的报告等基本问题进行了比较全面的规范 ISO 19113 提供了总体框架,是另外两个标准的基础 如何描述数据质量是数据质量标准首先要解决的问题。只有这个问题解决了,才谈得上质量的量度、评价与报告。规定描述空间数据质量的元素和子元素是 ISO 19113 的核心内容。 ISO 19114 与 ISO 19138 数据质量的评价与度量的都是围绕 ISO 19113 提出的数据质量元素展开的。 系列标准相互依存,协同工作

存在问题:

存在问题 缺乏与国际标准接轨的数据质量系列国家标准 研究数据质量管理体系 数据质量检查方法及相应的工具

谢谢 !:

欢迎批评指导 谢谢 !

authorStream Live Help