数据挖掘技术为出口退税业务过程中所积累的原始数据的深层次使用提供了一种可行的手段,本文介绍了数据挖掘技术在出口退税业务中使用的目的,提出了出口退税数据挖掘的系统功能和实现方法,为税收管理提供了有力的决策支持。
1 引言
出口货物退(免)税,简称出口退税,其基本含义是一个国家或地区对已报送离境的出口货物,由税务机关将其在出口前的生产和流通的各环节已经缴纳的国内产品税、增值税、营业税和特别消费税等间接税税款退还给出口企业的一项税收制度。出口退税主要是通过退还出口货物的国内已纳税款来平衡国内产品的税收负担,使本国产品以不含税成本进入国际市场,与国外产品在同等条件下进行竞争,从而增强竞争能力,扩大出口创汇[1]。
我国从1985年开始,全面地实行了出口退税政策,并从1995年开始全面实行电子化管理,它是全国税务系统第一个全面推广应用的税收管理软件,是金关工程和金税工程的一个子系统,在强化出口退税管理,提高出口退税工作效率,防范和打击骗税上发挥了巨大的作用[2]。但是,目前的出口退税电子化管理只完成了出口退税业务的电子化操作,还未在决策的电子化方面取得较大进展。经过十多年的发展,积累了大量涉税信息,如何将这些“历史的、静态的”数据变成动态的、具有分析决策性质的信息已成为当前急需研究的课题[3],数据挖掘技术的出现使这种应用成为现实。
2 出口退税数据挖掘的目的和基本方法
现行的出口退税电子化管理主要是通过出口企业把申报退税的信息通过出口退税申报系统录入计算机并生成申报数据,然后再经过出口退税审核系统把企业申报的出口退税凭证的电子信息与税务机关接收到的其他部门(征税机关、海关和外管)传来的凭证信息进行比对,以达到审核出口退税凭证的合法性和真实性的目的,进而根据比对审核通过的数据进行退税。可以看出,目前的出口退税电子化管理只侧重了出口退税的单证信息的计算机审核,而对于挖掘审核通过的单证信息和各部门传递来的电子信息的价值方面存在着很大的不足。
随着金税二期网络建设的推动,各省现已基本实现了出口退税数据的省级大集中[4],这些数据都是各出口退税部门在日常的业务审核中积累下来的数据,十分宝贵,如何充分发挥其应有的作用,已成为人们研究的热点。
数据挖掘的目的就是分析出口企业的出口退税数据,挖掘这些数据与经济的内在联系,全面掌握本地区出口退税的产品结构、出口的贸易方式、出口产品的地区差异等,对于调整一个地区的产业结构、经济发展方向以及制定经济发展战略有着重要的参考价值;对于税务机关掌握出口企业的实际生产出口情况,培养税源,打击偷税漏税和防范出口骗税等方面有着重要的意义。
对于出口退税部门在日常的业务审核中积累下来的数据进行挖掘,主要是指在了解和掌握具体纳税人生产经营情况和财务数据的基础上,对纳税人的税收经济关系和税收缴纳状况进行客观评价和说明的分析,主要是通过对历史数据进行纵横比较分析和逻辑关系稽核来进行挖掘,以指导税收管理工作。
1) 横向比较分析
横向比较分析是指同一指标在不同个体、单位、地区之间的比较分析。横向比较分析最典型的分析例子就是同业税负分析。受市场均衡作用的影响,同一产品在生产技术工艺、原材料能源消耗方面有相近之处,适用税收政策有统一的要求,因此反映生产成本费用方面的指标有相同的规律特征。总结这种规律特征,以此检验个体数据指标的表现,找出差异较大的个体予以预警。
2) 纵向比较分析
纵向比较分析或历史数据分析是指同一个体的同一指标在不同历史时期的数据比较分析。常用的分析方法有趋势分析和变动率分析。分析的理论依据是大多情况下企业的生产经营是处于一种相对平稳的状态,不会出现突然的波动或大起大落现象。因此,如果企业生产能力没有作大的调整,一般情况下企业各个时期的数据指标彼此接近,不会出现大的差异。如果出现较大差异,应引起主管部门的注意,及时进行相关的纳税评估。
3) 数据逻辑关系稽核
受会计核算原理的约束和税收制度规定的制约,反映纳税人生产经营情况和财务状况的众多数据指标之间存在非常严谨的、相互依存的逻辑关系。这种逻辑关系决定了企业的纳税申报数据必须满足企业财务数据相关性的特定要求,检查这些数据逻辑关系是否吻合,可以鉴别企业申报数据的真实性和合理性,从而发现税收问题,堵塞征管漏洞。
3 出口退税数据挖掘的功能
数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能: 1) 趋势预测
数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。出口退税数据挖掘的预测趋势是对纳税人特定税收指标、经济指标或税收经济关系指标一段时期走势和趋向的分析和推断,了解和掌握税收经济的发展趋势,有利于判断未来出口退税形势的好坏,使出口退税做到心中有数。
趋势预测的两个基本要求是说明特定指标的发展方向和变化幅度,基础分析技术是时间序列分析技术,常用说明指标有变动率和平均变化速度等。
2) 关联分析
数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。
在出口退税评估工作中,可以利用企业财务报表、纳税申报表和出口退税汇总表等各项数据指标之间的相互逻辑关系进行核算检查,对于不满足应有逻辑计算关系的内容,即认为破坏了会计核算或税款计征关系,均应视为异常做进一步的深入分析。由于企业财务指标和出口退税申报数据有上百条之多,所以与此相关的逻辑计算关系也会在此基础上更为丰富和复杂,只有通过关联分析,才有可能在出口退税申报环节实现实时的出口退税评估工作。
3) 聚类分析
聚类分析是数理统计的一个分支,是运用事物本身所具有的某种数据特征,遵循“物以类聚”规律进行数据处理,为事物的分类管理提供数据支持的一种分析方法。借用这种方法开展税收分析,可将具有某种税收共同特征的事物聚集在一起,使我们更清楚地认识税收征管工作的分类特征。
聚类分析的基本原理是根据数据指标差异的绝对距离进行分类,结合矩阵分析技术,可以进行多指标的综合特征分析,为复杂事物的分类提供了一种可行的分析方法。聚类分析的关键是找到一组关系密切的相关指标,如退税增长、税源增长、退税变化弹性和出口影响等,均可以利用这一分析技术进行综合分析和技术处理。
4) 差异分析
数据库中的数据常有一些异常记录,从数据库中检测这些差异很有意义。差异包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。
差异分析的基本方法是测算不同样本同一指标的差异程度。差异分析的关键是建立评价差异的标准,有了标准才能说明差异的影响程度。表示差异程度可以用绝对值,也可以建立参照系用相对值。应用差异分析开展微观税收分析的典型分析案例就是同业税负分析模型。应用同业税负分析模型可以测算出各项相关指标的客观水平和样本离散状况,以此为标准比对个别检验样本的具体数值,超出差异允许界限的即为预警对象。
5) 波动分析
波动分析是描述税收事物运行变化平稳性的分析。税收事物的运行受经济变化影响、税收制度规定的约束和现有征管环境制约有其自身客观的规律。在经济运行相对平稳、税制不变的条件下,税收事物运行平稳与否,直接反映税收征管情况的影响作用。因此,开展波动分析,一定程度上可以了解和说明退税管理的表现,反映退税管理是否能按税源的发展变化规律同步开展,监督退税管理的执行情况。
4 出口退税数据挖掘的实现
出口退税数据挖掘应用系统由三部分组成:第一部分是由用户数据源到数据库的ETL过程;第二部分是根据出口退税业务模型建立业务智能分析模型;第三部分是面向税收管理人员进行数据的发布和多维分析工作。基本结构如图1所示。
数据的ETL(Extract-Transform-Load,数据抽取、转换、装载)过程采用微软的SSIS(SQL Server Integration Services)来完成数据预处理阶段对于原始数据的转换、清洗加载过程;数据库采用微软的SQL Server 2005,SQL Server 2005除了提供一个安全、可靠和高效的数据管理平台之外,它还是一个企业级数据整合平台,通过SSIS提供了构建企业级ETL应用程序所需的功能和性能,是一个集成的商业智能平台,通过Analysis Services提供了统一和集成的商业数据视图,可被用做所有传统报表、OLAP分析、关键绩效指标(KPI)记分卡和数据挖掘的基础。
SQL Server 2005分析服务提供了数据挖掘服务,支持集成其它个人或者企业的DM算法,并且将DM算法集成的复杂度不断降低,它主要是基于OLE DB for DM规范,使用灵活。开发人员能够利用数据挖掘功能开发应用程序,其数据挖掘语言非常类似于SQL,数据挖掘供应者是一个开放系统,因为它是OLE DB的一个部件,数据挖掘服务能够通过DSO(Decision Support Object)、或ADO可包含在任何用户应用程序中。将DM算法无缝集成到SQL Server的分析服务中,利用集成的DM算法来构建数据挖掘解决方案是一种理想的方式。
在SQL Server 2005数据挖掘平台中,创建关系型挖掘模型的语法如下:
Create mining model () using
它类似于建立一个关系表,其中包括输入、预测属性,每一个模型与一个数据挖掘算法相关联。
多维数据分析工具和报表工具使用统一空间模型UDM(Unified Dimensional Model),利用UDM中对业务实体的友好描述、等级导航、多视角、自动平滑翻译为本机语言等功能,可以实现出口退税数据挖掘过程中所得到的结果集的友好展示。
4 结束语
随着数据仓库技术的发展,数据挖掘会越来越发挥其独到的分析优势,特别是将挖掘出的新知识通过用基于OLAP的决策支持系统加以验证、结合,可以更好地为决策者服务。出口退税管理的电子化系统已经积累了大量的业务数据,可以为数据挖掘提供大量数据,数据仓库和数据挖掘技术在收税管理具有广阔的应用前景。
为了研究城市水资源综合规划中各类涉水规划对防洪的影响,分析了平原河网区城市的洪涝特性及洪涝灾害形成原因,提出了适用于平原河网区城市水资源综合规划的防洪安全校核计算方法.以太仓市水资源综合规划防洪安全校核计算为实例,根据该市土地利用特点和下垫面特性,分别建立相应的产汇流模型,计算不同规划条件下的河网洪水位,计算结果可以为制定满足太仓市防洪安全要求的水资源综合规划方案提供依据. 我国的涉水规划主要包...
建构主义从多维视角对传统教学进行了反思,引发了对传统师生观的深刻反思和重新定位。建构主义学习理论认为,民主平等是新型师生关系的核心,双向互动是新型师生关系的灵魂,合作探究是新型师生关系的桥梁。 论文关键词:建构主义;学习理论;师生关系 二十世纪中后期以来,建构主义在教育界掀起了一场声势浩大的革命浪潮。该理论从多维视角对传统教学进行了反思,并在此基础上形成了自己独特的观点和见解。与此同时,建构主...
人是社会人,又是文化人。人在跨文化交际中易犯文化错误。而文化错误往往比语言错误更产重。通过分析学生文化浏试中语用失误的原因,探讨在教学中如何导入文化因素,培养学生的语言和语用能力. 英国文化人类学家EdwardBTylor在1871年出版的《原始文化》一书中指出:“文化是一种复杂体,它包括知识、信仰、艺术、道德、法律、风俗以及其他社会习得的能力与习惯。”语言是人类用来表达...
课堂是学校的主要教学场所。如何提高课堂教学质量,一直是广大职教工作者关注的问题。更新教育观念,加强师资建设、开展教研活动、精心设计教案、关心后进学生等,都是行之有效的途径。当前激烈的生源竞争,导致了职校招生人学的“零门槛”现象,职校生源素质参差不齐。对此,职业教育如何适应社会需求,不断提高教育质量,是一个亟待解决的问题。笔者认为,抓好45分钟的课堂教学仍然是提高教学质量的重...
采用问卷调查的研究方法,对参加吉林省教育技术骨干培训者培训的教师进行了多维度的调查.调查内容包括:教育技术应用情况、教育技术应用中遇到的困难、接受教育技术培训情况以及对未来教育技术培训的期望与建议。经过调查分析,得出当前中小学教师教育技术能力的现状和培训中存在的问题,并提出了相关改进建议。 论文关键词:中小学教师;教育技术能力;教育技术培训 1调研方法 2009年1O一11月,共计88名中小...
通过区域环境现状分析,以及对规划主要内容和目标评述,认为西北诸河水资源综合规划的实施将给区域社会经济、生态和水环境等方面带来长期的、深远的有利影响,局部、暂时的不利影响是可以控制的,并针对这些不利影响提出了减免措施,即:优化水资源工程建设设计方案,合理选址选线,使大部分不可逆影响得以弱化或减免;加强对规划实施可能影响的重要城市河段水环境和生态环境敏感区的监测,切实掌握其变化情况,及时采取相应的补救...
随着经济建设的腾飞,我国城市交通建设和铁路建设的步伐也在加快,随之,城市综合交通规划设计也就成为摆在我们面前的一个新课题。1引言随着经济建设的腾飞,我国城市交通建设和铁路建设的步伐也在加快,随之,城市综合交通规划设计也就成为摆在我们面前的一个新课题。然而各种交通基础设施建设所带来的“大规模建设、大体量建筑以及前所未有的人口规模、资源耗费、环境破坏”等问题,已成为现代交通建设...
在严峻的形势之下,钢铁企业需要进行并购重组,以求得更大的生存发展空间。 0引言 中国工业和信息化部原材料司相关人士在第二届中国钢铁物流合作论坛上表示,中国钢铁业正面临企业大面积减产、全行业出现亏损、库存大量增加、成本与价格出现倒挂等四个方面的困难。中国钢铁业生产增速大幅回落,企业大面积减产,2008年前11个月产钢同比仅增2.6%,增幅回落14.2个百分点。11月上旬的平均日产水平与6月份相比...
介绍了中国科学技术大学图书馆纸质外文期刊订购的调整策略。 高校图书馆订购的外文期刊绝大多数属于科技类期刊,对于各高校的教学和科研工作起着非常大的支撑作用,特别对于研究型重点大学而言,外刊的齐备程度几乎是学校教师和科研人员对图书馆关注的唯一重点,图书馆年度经费中很大一部分用在了外刊的订购上。然而在外刊价格逐年上涨的形势下,图书馆有限的年度经费很难维持外刊订购的连续性,外刊订购品种只能一减再减。虽然...
随着我国改革开放的不断深入,特别是加入世贸组织后,我国与世界各国在政治、经济、文化等方面的交流越来越多,英语作为世界通用语,已被国家教育部列为初、高等教育的必修课,为培养具有国际竞争力的人才,英语教育从幼儿抓起已是大势所趋。与此同时,幼儿英语教学越来越受到重视。本文通过对进行幼儿英语教学的必要性和可行性、幼儿英语教学的目标、幼儿英语教学的内容、英语教学的实施、进行幼儿英语教学的意义、幼儿英语教学中...
影响因子:0.410
影响因子:1.510
影响因子:0.810
影响因子:0.000
影响因子:3.170
影响因子:0.540
影响因子:0.000
影响因子:20.830