当前位置:市统计局>经普专栏>普查方案

清查比对程序操作流程(试点用)
来源: 发布日期: 2018-09-07 作者:

         单位清查工作主要分为收集整理部门数据、编制清查底册、地毯式清查、数据编码与审核、查遗补漏上报清查结果和编制普查名录六个实施步骤,本操作流程重点针对清查比对程序涉及的业务工作,结合程序功能操作流程及数据处理中需重点关注的问题进行简要说明。程序详细功能介绍请参考第四次全国经济普查清查比对处理系统操作手册(初版)

一、收集整理部门数据(部门数据库模块数据接收和数据处理节点(参见方案P14)

处理的数据主要包括部分,一是省级获取的部门数据和名录数据,包括市场监管(工商)、税务单位名录信息二是市经普办收集本级编制、质检、民政、人社、司法、宗教、教育、卫生、交通、旅游、工商个体户等部门名录信息;三是区县获取的个体运输户资料。各级需对自己获取的数据进行整理导入和处理。

导入数据

整理导入部门数据和名录库数据

需将本获取的部门数据基本单位名录数据导入系统中区县用户需对区县获取的数据整理导入

(1)导入数据包

在导入基本单位名录节点,点击上传,电脑中选中需上传的数据文件,将数据包上传至系统中。支持txt、csv和excel格式文件

(2)建立指标匹配关系

对导入的数据,需将文件中指标系统指标进行对应,左边原始文件栏中标蓝色底色的指标,系统自动根据指标名称或上一次本部门数据指标对应情况默认对应,用户可默认对应关系进行调整。通过点击左边原始文件指标名称,将指标名称拖拽至待匹配字段中。

左边原始文件栏中为白色的指标,为未建立指标匹配关系指标,需要将此信息导入系统,可通过点击添加按钮,增加指标项。例如下图的台卡编号指标,可通过添加名称"台卡编号"指标,并原始数中台卡编号拖拽待匹配字段栏,建立指标匹配关系。

建立好的指标匹配关系,需点击确认按钮保存。点击导入按钮开始导入数据。

(3)数据导入

数据导入过程中,若存在单位记录所有指标完全一致的重复记录,系统自动覆盖。正常数据会直接导入对折行有分隔符问题数据会提示异常将异常记录下载修正重新导入

市场监管部门数据,需分工商登记(设立和变更)工商登记(注吊销工商年报单位、工商异常名录和工商严重违法失信名单,分类导入。

(4)导入获取的其他部门数据

不在现有列表中的部门,用户可通过"添加"功能建立部门导入节点导入数据操作同上。

数据处理

提高部门数据匹配为建立底册打好数据基础,需对部门数据进行处理和转换。方便数据处理系统数据导入门槛设置较低,允许数据先进系统再行清理。

清理名称代码中的空格和横杠等非法字符。

利用程序中"替换"功能,对统一社会信用代码、组织机构代码、单位名称中的乱字符成批替换。例如:对组织机构代码中横杠进行清理首先利用查询功能,将组织机构代码包含横杠的单位列出,点击替换按钮,选择组织机构代码指标,点击编辑,输入语句"replace(组织机构代码,'-','')",点击确定,进行批量替换。

转换单位类型

清查底册中单位类型分为1-法人,2-视同法人和3-产业活动单位。需着重关注部门数据中是否存在产业活动单位标记为3的情况,特别是对"五证合一"渠道获取的工商共享数据,及导入的名录库数据,需把产业活动单位的单位类型赋值为3。可利用查询功能,将需赋值单位查询出,并利用替换功能成批赋值

3.登记注册类型、机构类型等指标转换成标准赋值

部门数据中存在登记注册类型、机构类型等指标为汉字的情况,需要对此类单位转换成统计标准赋值,例如查询出登记注册类型为"股份有限公司"单位,批量替换成"160"查询出机构类型为"企业"的单位机构类型批量替换成"10"

4.查看审核关系差错清单清理部门数据

审核关系中的必要性审核差错,必须对报错数据进行清理,必要性审核差错的单位,不会进行下一步的比对合并。例如组织机构代码不足9位审核,需对报错单位的组织机构代码指标进行清理。可点击审核按钮,调取审核关系页面对选定的审核关系(不勾选则默认是全部点击审核按钮执行审核,并点击审核结果的数字查看单位清单。

5.标记无效单位

部门记录存在的关键指标缺失无效记录,可批量设置成无效单位,无效单位不再参与审核,也不进行比对合并。

6.行业代码2011向2017转换

清查使用的是2017版行业代码,部门提供的行业代码为2011版行业代码,在数据导入将行业代码指标对应到行业代码(2011指标中,在数据导入后,利用行业代码批量转换功能,一和多对一的代码,对照转换成行业代码(2017

7.数据下发

数据下发节点待下发单位中,可对区划只到本级,未赋值到下级的数据进行查看,通过区划代码精确到下级,可自动本单位分发下级下级用户发现非本辖区内的单位,可通过点击退回按钮,将单位反馈给上级重新分配下级反馈的需重新分配单位,可在反馈单位节点进行查看。

于区划代码未精确到地市区县的部门数据可通过行政区划智能编码功能,系统自动根据地址信息对区划代码进行智能编码。也可通过查询+替换的功能,对确定的区划代码进行赋值。对单条单位也可通过点选地区名称来自动赋值区划。

(若由区县用户执行比对合并操作,则在部门原始数据中就区划信息至少细化至区县级

智能赋码功能会根据用户的区划赋值情况,自动学习提高赋码准确度。提高赋码准确率,各地可将掌握的地址信息关键词与区划代码的词条制度管理-地址模板维护节点对地址库词条进行添加和维护

8.剔除重复数据

一部门内的代码或名称重复数据,可利用排重功能进行筛选查看。确认为需剔除的单位,可选择将此单位标记为无效。同部门存在未清理的重复数据,在比对合并中系统任选一条单位。

9.删除单位

对于错误操作导入的数据,可通过删除功能对数据进行彻底删除对于进入比对合并的数据,部门原始数据无法删除,只有删除比对合并后的记录,才能对部门原始数据进行删除。

二、比对合并部门记录和名录数据(部门数据库模块比对合并节点)

整理好的部门数据名录数据,通过比对合并生成单位比对数据库比对规则为:当单位详细名称相同时,若统一社会信用代码或组织机构代码相同,或者统一社会信用代码的9-17位与组织机构代码相同,则为同一单位忽略指标中大小写区别对同一单位,除名称代码匹配指标外,其他指标按优先级顺序自动进行合并。对未完全上的单位,代码或名称仅一项一致的单位,需进一步人工认定后合并完全不匹配的单位,即代码名称均不相同的单位,作为新增记录直接进入单位比对库。

(一)执行比对合并

1.设置合并规则

通过点击设置合并规则,对代码、名称外其他指标的合并优先顺序进行设置。例如下图中的法定代表人指标,可通过拖拽方式,将左侧不同部门数据中法定代表人指标进行优先级排序。进行排序的指标部门,其对应数据将不进入单位比对库,例如机构类型指标若只对民政、工商两个部门的数据进行优先级排序,则其他部门的机构类型指标数据将不参与合并。(国家登记信息以登记主管部门优先、行业信息以行业主管部门优先的原则,了指标合并优先顺序

2.执行合并

省级市级或区县用户执行比对合并操作。若区县用户操作,在部门原始数据区划信息至少精确到区县一级。

选取需合并的部门,点击执行,进行合并。已合并部门原始信息合并状态指标会自动标注为"已合并"。合操作可执行多次,对于已合并的单位不再重复合并,未合并的单位补充合并进单位比对库。

 

(二)人工合并

未能自动合并的单位,代码或名称仅一项一致的单位,需进一步人工认定后合并确定一单位的,通过点选保留的代码和名称后,点击合并按钮,其他指标按优先级顺序,自动合并成一记录进入单位比对库中。也可多条记录选定代码或名称后,点击批量合并按钮,成批执行合并操作。

不是同一单位的记录,可通过点击"转为新增单位"将此记录进入单位比对库中若认定记录错误数据或无效数据,也可通过点击"删除"直接彻底删除该记录的部门原始数据。

系统在自动或人工认定后合并过程中,会将部门原始记录部门来源系统主键等指标自动赋值到单位比对库的对应记录中,建立比对数据与原始数据的挂接关系。同时自动根据工商注销单位信息,将单位比对库中对应单位自动标记为无效,根据正常纳税单位、参保单位、年报单位、异常单位、严重违法失信企业等信息,自动在单位比对库中对单位状态指标进行标记。

、编制清查底册(单位比对数据库模块)

用户对单位比对数据库数据进行整理可生成清查底册,底册数据包推送给pad

(一)整理单位比对数据库

防止错乱数据进入清查底册,完善行业等指标信息,提底册质量需对单位比对数据库进行数据处理。

完善区划信息

对区划代码不足12位的单位,利用区划代码智能赋码等功能,尽量对区划进行细化

2.预赋行业代码和经济活动代码

可利用行业智能编码功能对行业代码进行赋码。点击自动编码按钮,对选中单位进行智能行业代码推荐,选选择的行业代码,点击入库操作,即可将此行业代码赋值到单位的行业代码2017指标中。也可通过检索行业分类查询,进行精准搜索

对活动名称指标中有下拉选项的单位,可进行6经济活动代码的点选并点击入库操作,对经济活动代码指标进行赋值。

3.清理错乱指标信息

利用审核条件,对非法或错乱数据进行清理。数据处理节点,点击审核,选中审核条件(默认为全部)点击审核按钮执行点击审核结果查看差错清单。

(二)生成清查底册

单位比对数据库整理完毕后,可点击生成底册按钮,查询结果,生成清查底册。其中单位未通过必要性审核的单位不参与生成底册生成底册的单位,在单位比对库"是否生成底册"指标自动标记为已生成底册。

生成底册时,系统会自动对底册单位赋值底册唯一码。底册信息可在清查底册节点进行查看,并通过点击导出数据,生成底册数据包,自动推送给pad数据接收平台。

清查结果编码审核(单位清查结果库清查结果数据处理和行业智能赋码节点

需对接收的pad采集数据,进一步审核对行业代码、经济活动代码区划代码进行赋码,未领取统一社会信用代码组织机构代码的单位赋统计临时码。

1.利用审核条件,完成表内和表间审核关系的差错修改。尤其清查表中关键属性指标、重名重码法人和分支机构关联关系等情况着重审核。

2.利用行业智能编码等功能对行业代码进行赋码,特别是对核实后主要业务活动不为空的单位,即主要业务活动有变更的单位,重新编码系统可支持对法人和产业清查表、个体户清查表中行业代码编码。对需编制经济活动代码的单位,根据采集的主要业务活动等信息,经济活动代码编码。

3.对农业法人单位下属产业一栏表中"是否属于第二、三产业的单位"指标,根据一览表中主要业务活动,进行人工录入赋值

4.利用区划智能赋码等功能,对区划代码为空不标准的单位进行赋码,特别是对建筑业单位的注册地区划,需精确到12位

5.利用组织机构代码赋码功能,对未领取统一社会信用代码和组织机构代码的单位,赋统计用临时代码。省管理的临时码细化给地市分段管理,需将本省细分分段情况提前提供给公司进行设置,否则本功能将在全省码段范围内赋值。

通过程序的高级查询按钮,筛选出组织机构代码和统一社会信用代码同时为空的企业,如下图:

在查询结果的基础上点击"组织机构代码赋码"按钮进行自动赋码。

 

、查遗补漏(单位清查结果库模块查遗补漏节点

方案要求,试点地区要对试点范围内单位清查表与清查底册进行比对,对清查表与底册未建立一一对应关系的单位清查表比底册多出单位、以及底册比清查表多出单位重点核实。

1.对同一单位系统自动建一一对应关系

系统接收清查数据时,会将清查表中底册唯一标识码为空,名称代码在底册中存在的单位,底册自动建立挂接关系,同时底册唯一标识码指标赋值到清查表中,并将底册的核实情况自动赋值为1-正常填报。

2.对名称代码不完全一致单位人工确认

对于清查表(底册唯一标识码为空)与底册名称或代码不完全一致单位(单位名称、统一社会信用代码、组织机构代码一项相同人工认定后建立对应关系。查遗补漏建立对应关系节点,可查看需人工认定单位为同一单位,可通过点击建立对应关系按钮进行挂接,系统会自动将底册的核实情况赋值为1-正常填报,同时底册唯一标识码指标赋值到清查表中。

对于底册中名称代码在采集的清查表中均不存在的单位,也可通过"查找相似单位"功能,将底册名称在清查中查找,显示出清查表中存在的单位名称相似度较高的单位,若认定为与底册同一家单位,则可通过点选建立对应关系。

3.待清查单位

对底册核查情况为空以及部门补充提供的单位,可再次生成清查底册。通过点击更多按钮中生成底册功能,根据查询筛选结果,补充生成清查底册并点击导出底册按钮,导出底册数据包。

4.底册中标记核查情况

底册中核查情况为空的单位,可在比对程序中对核查情况指标进行批量标记。在单位比对数据库的清查底册节点,点击单位,单条录入核查情况,或利用替换功能,批量替换赋值。比对系统中未实现日志管理,对批量替换误操作赋值,无法自动恢复,核查情况的批量赋值务必谨慎)

编制普查单位名录

对法人单位和产业活动单位分类标记。