泓域咨询/承德关于成立大数据应用技术公司可行性报告目录第一章 项目概况 7一、 项目名称及建设性质 7二、 项目承办单位 7三、 项目定位及建设理由 7四、 项目建设选址 9五、 项目总投资及资金构成 9六、 资金筹措方案 9七、 项目预期经济效益规划目标 10八、 项目建设进度规划 10九、 项目综合评价 10主要经济指标一览表 10第二章 市场和行业分析 13一、 大数据市场构成 13二、 市场的细分标准 13三、 行业未来面临的机遇与挑战 19四、 竞争战略选择 26五、 行业未来发展趋势 30六、 扩大总需求 33七、 大数据全生命周期管理阶段 37八、 大数据行业发展背景 41九、 营销活动与营销环境 47十、 大数据行业市场规模 48十一、 关系营销及其本质特征 50十二、 以利益相关者和社会整体利益为中心的观念 52十三、 营销部门与内部因素 54十四、 市场需求测量 55第三章 公司治理分析 59一、 股权结构与公司治理结构 59二、 资本结构与公司治理结构 62三、 公司治理的主体 66四、 专门委员会 68五、 管理腐败的类型 73六、 决策机制 75第四章 项目选址 80一、 构建开放创新平台体系 81第五章 企业文化方案 84一、 企业核心能力与竞争优势 84二、 企业先进文化的体现者 85三、 企业文化的创新与发展 91四、 “以人为本”的主旨 102五、 企业文化理念的定格设计 106六、 企业文化的特征 111第六章 经营战略分析 116一、 营销组合战略的选择 116二、 技术竞争态势类的技术创新战略 118三、 集中化战略的优势与风险 126四、 企业文化与企业经营战略 127五、 企业技术创新战略的构成要素 130六、 人力资源在企业中的地位和作用 132七、 总成本领先战略的实现途径 133八、 企业战略目标的构成及战略目标决策的内容 135第七章 人力资源分析 139一、 企业员工培训项目的开发与管理 139二、 福利管理的基本程序 146三、 进行岗位评价的基本原则 149四、 企业培训制度的执行与完善 151五、 企业劳动分工 152六、 薪酬体系设计的前期准备工作 155七、 培训效果评估方案的设计 157第八章 SWOT分析 160一、 优势分析(S) 160二、 劣势分析(W) 161三、 机会分析(O) 162四、 威胁分析(T) 163第九章 运营管理 171一、 公司经营宗旨 171二、 公司的目标、主要职责 171三、 各部门职责及权限 172四、 财务会计制度 175第十章 投资方案 181一、 建设投资估算 181建设投资估算表 182二、 建设期利息 182建设期利息估算表 183三、 流动资金 184流动资金估算表 184四、 项目总投资 185总投资及构成一览表 185五、 资金筹措与投资计划 186项目投资计划与资金筹措一览表 186第十一章 财务管理方案 188一、 对外投资的目的与意义 188二、 营运资金管理策略的主要内容 189三、 资本结构 190四、 营运资金管理策略的类型及评价 196五、 计划与预算 199六、 财务管理的内容 200七、 对外投资的影响因素研究 203八、 影响营运资金管理策略的因素分析 205第十二章 项目经济效益 208一、 经济评价财务测算 208营业收入、税金及附加和增值税估算表 208综合总成本费用估算表 209利润及利润分配表 211二、 项目盈利能力分析 212项目投资现金流量表 213三、 财务生存能力分析 215四、 偿债能力分析 215借款还本付息计划表 216五、 经济评价结论 217第十三章 总结评价说明 218报告说明传统数据库以集中式架构为主,集中式架构由一台或多台主计算机组成中心节点,数据存储以及整个系统的业务单元都集中部署于该中心节点中,系统所有的功能均由中心节点集中处理。
每个终端或客户端仅仅负责数据的录入和输出,而数据的存储与控制处理完全交由主机完成分布式架构下,软件组件分布在不同主机上,主机之间通过网络连接进行通信和协调根据谨慎财务估算,项目总投资2150.01万元,其中:建设投资1265.78万元,占项目总投资的58.87%;建设期利息14.13万元,占项目总投资的0.66%;流动资金870.10万元,占项目总投资的40.47%项目正常运营每年营业收入9400.00万元,综合总成本费用7254.75万元,净利润1572.67万元,财务内部收益率58.11%,财务净现值5359.62万元,全部投资回收期3.30年本期项目具有较强的财务盈利能力,其财务净现值良好,投资回收期合理综上所述,本项目能够充分利用现有设施,属于投资合理、见效快、回报高项目;拟建项目交通条件好;供电供水条件好,因而其建设条件有明显优势项目符合国家产业发展的战略思想,有利于行业结构调整本报告基于可信的公开资料,参考行业研究模型,旨在对项目进行合理的逻辑分析研究本报告仅作为投资参考或作为参考范文模板用途第一章 项目概况一、 项目名称及建设性质(一)项目名称承德关于成立大数据应用技术公司(二)项目建设性质本项目属于技术改造项目二、 项目承办单位(一)项目承办单位名称xxx有限公司(二)项目联系人贾xx三、 项目定位及建设理由大数据集成包括大数据采集和大数据整合。
大数据采集主要是通过各种技术手段将分散的海量内容数据(文本、音频、视频等)、行为数据(访问、查询、搜索、会话、表单等)、工业生产数据(传感器数据、监控数据)等从业务系统中收集出来由于大数据本身具有分散、海量、高速、异质的特征,采集难度较大,因此保证数据采集的稳定性、可靠性、高效性、可用性和可扩展性等是主要的技术目标,越来越多的企业开始选用专业的数据采集服务大数据整合的目标是将各种分布的、异构的数据源中的数据抽取后,进行清洗、转换,最后加载到数据仓库或数据集市中,作为数据分析处理和挖掘的基础;这个过程常常也被称为ETL(Extract/抽取,Transform/转换,Load/加载),通常ETL占到整个数据仓库开发时间的60%~80%大数据时代,数据整合软件的市场也开始了整体的技术升级,主要解决两个主要技术问题,一是独立的ETL应用服务器的计算能力普遍不足,二是无法处理半结构化和非结构化数据经过几年的技术发展,ETL过程逐步演进为ELT,即数据抽取后直接加载(Load)到大数据平台中,再基于大数据平台的计算能力来实现数据转换(Transform),不再依赖ETL应用服务器做抽取和转化工作,这样可以解决ETL应用服务器的处理能力不足问题,充分利用大数据平台的分布式计算能力提升数据集成的效率和稳定性。
展望二〇三五年,我市将与全国全省同步基本实现社会主义现代化,全面建成“生态强市、魅力承德”构建形成京津冀一体化格局;全市经济实力、创新能力大幅提升;基础设施条件得到根本改善;基本实现新型工业化、信息化、城镇化、农业现代化,建成现代化经济体系;社会文明达到新的高度,文化软实力显著增强,实现教育现代化;基本实现治理体系和治理能力现代化,平安承德建设达到更高水平;城乡区域发展和居民生活水平显著提升,基本实现基本公共服务均等化,人民生活更加美好;高标准建成京津冀水源涵养功能区、京津冀生态环境支撑区、国家可持续发展议程创新示范区和国际旅游城市四、 项目建设选址本期项目选址位于xx(待定),区域地理位置优越,设施条件完备,非常适宜本期项目建设五、 项目总投资及资金构成(一)项目总投资构成分析本期项目总投资包括建设投资、建设期利息和流动资金根据谨慎财务估算,项目总投资2150.01万元,其中:建设投资1265.78万元,占项目总投资的58.87%;建设期利息14.13万元,占项目总投资的0.66%;流动资金870.10万元,占项目总投资的40.47%二)建设投资构成本期项目建设投资1265.78万元,包括工程费用、工程建设其他费用和预备费,其中:工程费用690.31万元,工程建设其他费用553.42万元,预备费22.05万元。
六、 资金筹措方案本期项目总投资2150.01万元,其中申请银行长期贷款576.75万元,其余部分由企业自筹七、 项目预期经济效益规划目标(一)经济效益目标值(正常经营年份)1、营业收入(SP):9400.00万元2、综合总成本费用(TC):7254.75万元3、净利润(NP):1572.67万元二)经济效益评价目标1、全部投资回收期(Pt):3.30年2、财务内部收益率:58.11%3、财务净现值:5359.62万元八、 项目建设进度规划本期项目建设期限规划12个月九、 项目综合评价该项目符合国家有关政策,建设有着较好的社会效益,建设单位为此做了大量工作,建议各有关部门给予大力支持,使其早日建成发挥效益主要经济指标一览表序号项目单位指标备注1总投资万元2150.011.1建设投资万元1265.781.1.1工程费用万元690.311.1.2其他费用万元553.421.1.3预备费万元22.051.2建设期利息万元14.131.3流动资金万元870.102资金筹措万元2150.012.1自筹资金万元1573.262.2银行贷款万元576.753营业收入万元9400.00正常运营年份4总成本费用万元7254.75""5利润总额万元2096.89""6净利润万元1572.67""7所得税万元524.22""8增值税万元403.03""9税金及附加万元48.36""10纳税总额万元975.61""11盈亏平衡点万元3060.17产值12回收期年3.3013内部收益率58.11%所得税后14财务净现值万元5359.62所得税后第二章 市场和行业分析一、 大数据市场构成大数据行业主要解决大数据的存储、处理、分析和价值发现等问题,实现大数据的业务价值。
从产品和服务来看,大数据市场产品和服务包括三个主要部分,即大数据硬件、大数据软件、大数据专业服务包括针对数据仓库、数据湖、数据集市、运营平台、知识图谱、智能决策、情报搜索等方面的数据应用系统,以及基于大数据技术的行业或业务线应用软件,如应用于数字化运营、数字化决策、智能制造、预测分析、数字营销、智能风控、政府行业的一网通办、疫情防控等领域的应用软件二、 市场的细分标准(一)消费者市场细分的标准消费者市场细分标准可归纳为四大类,其因素有些相对稳定,多数则处于动态变化中1、地理因素地理因素标准即按照消费者所处的地理位置、自然环境细分市场,具体变量包括国家、地区、城市规模、不同地区的气候及人口密度等处于不同地理位置和环境下的消费者,对同一类产品往往会呈现出差别较大的需求特征,对企业营销组合的反应也存在较大的差别例如希尔顿酒店会根据所处的地理位置设计个性化的房间:美国东北部酒店更雅致和全球化,而西南部的酒店更乡村化;零售巨头如沃尔玛、凯马特都允许他们的区域经理储存货物以适应当地需求地理细分对不同区域的识别和划分也有意义,企业可以根据产品在该区域上市的时间,将市场分为引人期或发育期市场(1~5年),成长期市场(6~11年),成熟期市场(11年以上)。
显然,这样的划分有利于识别不同阶段市场的特征,制定具有针对性的营销策略就总体而言,地理环境中的大多数因素是一种相对静态的变量,企业营销必须研究处于同一地理位置的消费者和用户对某一类产品的需求或偏好所存在的差异,而且必须同时依据其他因素进行市场细分2、人口因素人口因素指各种人口统计变量,包括年龄、婚姻、职业、性别、收入、教育程度、家庭生命周期、国籍、民族、宗教、社会阶层等比如,不同年龄、受教育程度不同的消费者在价值观念、生活情趣、审美观念和消费方式等方面会有很大的差异以年龄、家庭人口和收入为例,看其对某产品需求的制约某家具公司在市场调查中发现与家具销售关联最密切的人口变量有以下三项:户主年龄、家庭规模和收入状况企业在选择目标市场时,可以根据本企业的营销目标及其预期利润,分别考虑各个细分市场的家庭数目、平均购买率、产品的竞争程度等因素经过分析研究和预测,即可比较准确地评估出每个细分市场的潜在价值对于全球企业来说,这些人口统计变量的相关信息从各国政府或国际组织公布的统计资料中可以查到各个国家人口的预期寿命、年龄结构等因素对食品、化妆品、服装、人寿保险等行业中的全球企业细分全球市场有特别重要的意义。
需要注意的是,在用人口因素来进行市场细分时,用单一标准细分市场很容易得出偏颇的结论,需要企业界和其他细分标准对细分市场做出进一步的细化研究,从而发现显著的顾客需求特征差异,以分别制定针对性的营销战略及策略3、心理因素心理因素标准即按照消费者的心理特征细分市场按照上述几种标准划分的处于同,一群体中的消费者对同类产品的需求仍会显示出差异性,可能原因之一是心理因素发挥作用心理因素包括个性、购买动机、价值观念、生活格调、追求的利益等变量比如,生,活格调是指人们对消费、娱乐等特定习惯和方式的倾向性,追求不同生活格调的消费者对商品的爱好和需求有很大差异越来越多的企业,尤其是服装、化妆品、家具、餐饮、旅游等行业的企业越来越重视按照人们的生活格调来细分市场消费者的个性、价值观念等心理因素对需求也有一定的影响,企业可以把具有类同的个性、爱好、兴趣和价值取向相近似的消费者集合成群,有针对性地制定营销策略在有关心理因素的作用下,人们的生活方式可以分为“传统型”“新潮型”“奢靡型”“活泼型”“社交型”等不同类型追求的利益是指消费者在购买过程中对产品不同效用的重视程度一项对亚洲女士服装市场的调查表明,亚洲女士喜爱紧身服装有以下原因:视觉上更娇柔、形体更美丽、更加自信等,但不同国家的女士的追求在心理上仍有差异。
在不同国家也可能存在同处一个社会阶层或具备共同价值观、共同生活方式的消费群4、行为因素行为因素标准即按照消费者的购买行为细分市场,包括消费者进入市场的程度、使用频率、偏好程度等变量按消费者进入市场程度,通常可以划分为常规消费者、初次消费者和潜在消费者一般而言,资力雄厚、市场占有率较高的企业,特别注重吸引潜在购买者,企业通过营销战略,特别是广告促销策略及优惠的价格手段,把潜在消费者变为企业产品的初次消费者,进而再变为常规消费者而一些中、小企业,特别是无力开展大规模促销活动的企业,主要注重吸引常规消费者在常规消费者中,不同消费者对产品的使用频率也悬殊,可以进一步细分为“大量使用户”和“少量使用户”例如,根据二八定律,商业银行80%的利润都来自于占顾客数量20%的高端客户,剩余20%的利润由普通储户提供,因此抓住“少量使用户”,就能实现利润的最大化因此,许多企业自然把大量使用者作为自己的销售对象消费者对产品的偏好程度,是指消费者对某品牌的喜爱程度,据此可以把消费者市场划分为四个群体:绝对品牌忠诚者、多种品牌忠诚者、变换型忠诚者和非忠诚者在“绝对品牌忠诚者”占很高比重的市场上,其他品牌难以进入;在“变换型忠诚者”占比重较大的市场上,企业应努力分析消费者品牌忠诚转移的原因,以调整营销组合,加强品牌忠诚程度;而对于那些“非品牌忠诚者”占较大比重的市场企业来说,则应审查原来的品牌定位和目标市场的确立等是否准确,并且随市场环境和竞争环境变化重新对定位加以调整。
二)生产者市场细分的依据细分消费者市场的标准,有些同样适用于生产者市场如地理因素、追求的利益、使用者状况等因素,但还需要考虑一些其他的变量生产者市场常用的细分变量是用户变量,主要包括行业、公司规模、地理位置等1、行业细分生产者市场的用户购买产品通常是为了生产用于出售的产品或服务,用户所处行业不同,其生产者需求会有很大差异例如,电脑制造商采购产品时最重视的是产品质量、性能和服务,价格并不是最主要因素;飞机制造商所需要的轮胎必须达到的安全标准比农用拖拉机制造商所需轮胎的安全标准高得多2、规模细分用户规模也是细分产业市场的一个重要变量用户规模不同,其购买数量存在着很大差异大用户虽少,购买量大;小用户虽多,其购买量小在现代市场营销实践中,许多公司建立适当的制度来分别同大客户和小客户打交道例如,一家办公室用具制造商按照规模将用户细分为两类:一类是大客户,由该公司的全国客户经理负责联系;一类是小客户,由外勤推销人员负责联系3、地理细分企业可用地理变量确定重点的服务地区由于自然资源、气候条件、生产的要求等存在差异,每个国家都会形成一些产业群,这就决定了生产者市场比消费者市场在地理上更为集中按地理区域细分生产者市场,有助于企业设计恰当的营销组合,充分利用销售资源和网络,降低销售费用。
除了用户变量外,生产者市场还有多种细分标准美国的波罗玛和夏皮罗两位学者,提出了一个生产者市场的主要细分变量表,比较系统地列举了细分生产者市场的主要变量,并提出了企业在选择目标顾客时应考虑的主要问题,对企业细分生产者市场具有一定的参考价值三、 行业未来面临的机遇与挑战1、行业面临的机遇(1)产业政策集中出台,多层次政策体系日益健全十八届五中全会提出“实施国家大数据战略”以来,国务院及发改委、科技部、工信部等部门相继出台一系列大数据鼓励扶持政策,在国务院印发的《促进大数据发展行动纲要》指出,建立安全可信的大数据技术体系是推进大数据产业基础研究和核心技术攻关的重要目标2021年3月,在我国“十四五”规划和2035年远景目标纲要提出,培育壮大人工智能、大数据等新兴数字产业,充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统行业转型升级,打造数字经济新优势2021年3月国务院在政府工作报告中提出,加快数字化发展,打造数字经济新优势,协同推进数字产业化和产业数字化转型,加快数字社会建设步伐,提高数字政府建设水平,营造良好数字生态,建设数字中国同时,自“新基建”在2018年12月中央经济工作会议上被首次提出以来,中央和各地政府已经密集部署了一系列围绕“新基建”建设的方针和政策。
2020年4月,国家发改委明确了“新基建”是以技术创新为驱动,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级、融合创新等服务的基础设施体系其中,“在新一代信息技术关键领域锻长板的重要举措包括:推动新一代信息技术与制造业融合发展,加速工业企业数字化、智能化转型,提高制造业数字化、网络化、智能化发展水平,推进制造模式、生产方式以及企业形态变革,带动产业转型升级未来新兴产业及数字经济的发展将更依赖于数据资源,数据基础设施建设也是支撑5G、数据中心、工业互联网等新一代信息技术基础设施的基础,因此大数据是“新基建”的重要组成部分,也将推进大数据底层软件等核心国产软件的快速发展国家层面的积极政策为大数据行业的快速发展营造了良好的政策环境,企业和政府大力推动数字化转型,旨在实现企业运营和社会治理的效率提升政府和企业持续加大在IT产品和服务方面的投入,以满足日益增长的业务数字化需求,大数据行业作为企业及政府数字化转型的关键基础软件,有望受数字化转型趋势的推动而带来重大发展机遇2)数据管理软件国产化趋势明显,国产大数据产品有望实现换道超车国内数据管理软件基本被Oracle、IBM和微软为代表的国外关系型数据库厂商主导,国产软件产品渗透率低。
随着国内客户越来越重视数据与信息安全,国产软件产品在关键领域实现替代成为其中重要环节,越来越多的客户已经开始或计划相关软硬件的采购计划大数据时代下,数据管理软件正在逐步由集中式架构软件向分布式架构软件演进,国产大数据产品有望实现换道超车,对国外数据管理软件进行替代从功能来看,基于新兴分布式架构的国产大数据产品已经能满足市面上绝大多数数据应用场景基础需求但国产大数据产品能否在市场竞争中胜出、占据更多的市场份额,仍然取决于国产大数据产品能否构建自主研发的生态以及产品的全球竞争力目前,为保障国家信息安全,自主研发的国产大数据生态体系正在形成,此前国产软硬件发展面临的格局分散、生态基础不完善、规模用户群体缺乏等障碍正被逐步攻克随着国产大数据生态体系进入快速协同发展阶段,国产大数据产品与服务迎来较好的发展机遇3)数据成为新生产要素,各行业的大数据应用需求巨大2020年4月,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》指出,数据已成为继土地、劳动力、资本、技术之后的新一代生产要素,是数字经济发展的基础性、关键性、决定性的生产要素,对经济发展、社会治理、人民生活产生着重大而深刻的影响。
激活数据要素潜能,加快数字经济、数字社会、数字政府建设,以数字化驱动生产方式、生活方式和治理方式变革成为我国当下发展的重点企业建设数字化能力,高效解决企业运营中的问题,优化企业业务流程、提高效率,成为企业发展的核心竞争力之一,在金融、交通、能源、制造等国民经济重要领域实际提升数字化能力需求巨大此外,在政府、企业数字化程度提高后,数据走向资源化是大势所趋,在数据资源化的过程中,建立行业间高效的数据交换机制,实现数据的互联互通、信息共享、业务协同,以成为整合信息资源,深度利用分散数据的有效途径加快数字化转型,构建数据共享服务体系,促进数据与业务应用快速融合,将助力中国经济从高速增长转向高质量发展,推动数字中国建设4)大数据应用的快速发展,推动大数据管理平台需求的快速增长近年来,大数据增长集中于物联网设备、多媒体、日志、社交信息等,这些数据具有数据类型多、数据量大、流转速度快、价值密度低的特点传统关系型数据库无法满足处理半结构化及非结构化数据需要,具有综合能力的大数据管理平台有易于扩展、无序存储、分布式架构的特性,相比传统关系型数据库,更能满足对这些数据的存储需求大数据管理平台不仅具有存储管理海量数据能力、数据处理性能高和易于扩展的特性,还可以保持传统关系数据库支持ACID和SQL查询等特性,支持关系数据模型。
在大数据市场发展下,大数据管理平台需求快速增长5)数据价值的深度挖掘需求将带动智能分析工具的快速发展智能分析工具主要专注于为数据预处理、特征工程、数据建模、预测分析等数据分析挖掘关键过程提供工具和相关解决方案,是企业实现对海量数据的深度挖掘的重要工具随着大数据环境下,数据分析复杂程度的加深,数据科学平台需要持续优化其平台流程、协作及模型治理特性,以保持与软件开发中最佳实践一致同时,数据科学平台厂商也将通过整合针对算法筛选、分布式模型训练、模型管理、知识图谱和高性能推理等任务的创新解决方案来实现差异化竞争为了在大数据环境下快速帮助客户实现人工智能赋能的商业决策,智能分析工具将迎来快速发展机遇,在云原生、AI工程化、低代码、隐私安全、云边一体等方面发挥更大的作用2、大数据行业的挑战(1)技术创新与支撑能力有待进一步提高技术创新是推动大数据产业发展的内在动力,但是目前我国技术创新对于大数据产业的引领作用仍然不强一方面,国内企业对大数据核心技术、开源技术和相关生态系统影响力总体较弱另一方面,大多数大数据企业的创新仍以模仿性、渐进性创新为主,突破性、颠覆性创新偏少,自主研发具有国际影响力的先进技术较少,同质化竞争日益加剧。
此外,由于我国基础科学技术水平研发投入相对不足,大数据底层技术投入与国外存在较大差距,虽然具有大数据应用的需求,但较少通过扎实的底层技术手段来推动创新,我国大数据技术创新能力有待持续提高2)对开源体系的依赖程度相对较高基于开源的数据库技术,或部分开源的功能方案,已经成为当前众多企业的软件技术建设重要模式,目前数据库开源体系由国外主导众多软件开发者对于开源软件的认知较有限,甚至误以为开源软件等同于免费软件,可以不受限制地随意使用事实上,开源软件的著作权既没有被放弃也没有过期,其修改和发行等仍然要受到版权法或者开源软件许可证的制约,开源软件知识产权风险分为版权侵权风险,专利侵权风险、商标侵权风险三大类因此市场对待目前开源体系的法律风险意识有待提高,自主研发的国产数据库软件市场占有率有待进一步提升,降低对国外开源体系的依赖3)企业对于数据价值的认知及运用能力有待提高近年来,越来越多企业认识到数字化转型的必要性,但是对于数据管理的认知水平较多停留在收集数据、存储管理数据的层面,对于如何把数据有效运用及相关认知有待提高,对数据平台、数据技术的资源投入不足企业往往只是在部分业务实现数字智能化,各个板块的协同不足,各个部门的信息孤岛现象明显,整个企业的数智化缺乏完整规划,企业对数字化转型的目标和路径不够清晰。
在此环境下,中国数据管理软件服务厂商在聚焦于内部产品研发和技术迭代的同时,也需加强对下游实际的业务场景和大数据使用需求的逐步理解、适配,使得更多企业可以容易的运用大数据解决发展面临的数字化转型需求4)专业人才短缺问题成发展瓶颈我国仍存在严峻的大数据人才短缺问题,尤其紧缺基础技术研发、专业咨询、数据分析挖掘等方面的专业人才以及兼具专业运营能力、行业动态理解力、解决问题能力的多学科复合型人才,难以满足大数据产业的高速发展需求一方面,我国高科技人才储备不足,高科技人才储备难以应对与日俱增的大数据人才市场需求另一方面,我国大数据人才培养体系不完善,大数据人才培养体系起步晚,规模小,层次和模式相对单一,技能知识和理念落后,难以有效匹配产业发展速率虽然近几年随着我国产业数字化转型的发展,数字科技行业的从业人员逐步增多,但从事基础软件领域研究的专业人员仍然稀缺,尚不能满足大数据行业对于高端专业人才的需求大数据人才的不足一定程度上影响到大数据产业的发展,业内公司为争取优秀人才,造成行业内人才竞争不断加剧四、 竞争战略选择竞争者的反应模式、实力等特征决定了本公司竞争战略选择1、竞争者反应模式与竞争战略选择竞争者反应模式指本公司对竞争者的攻击战略实施之后竞争者的回应方式。
竞争者常见的反应模式有以下四种1)从容型竞争者从容型竞争者指竞争者对某些特定的攻击行为没有迅速反应或强,烈反应这类竞争者“从容不迫”的原因是多种多样的一是认为自己的顾客忠诚度高,不会转换购买这类竞争者通常实力强大,市场份额高,品牌知名度高,市场掌控能力强对于其他同类企业可能不放在眼里,认为小泥鳅掀不起大风浪企业选择此类竞争者作为攻击对象,应当进行投入产出分析,测定所投入的竞争资金能否收到预期效果,能否吸引竞争者顾客转换购买如果竞争者的顾客果真不会转换购买,则本公司的竞争战略和策略就是无效或低效的,竞争资金投入就是不值得的二是竞争者正在对该业务进行收割榨取竞争者或者认为该产品已经处于衰退期,没有大力发展的价值,没有必要费力地争夺市场扩大份额;或者正在进行战略转移,减少甚至放弃该业务因此,不打算继续投入资金应对竞争,能销多少就销多少,能得多少利润就得多少利润企业选择这类竞争者作为攻击对象,首先要分析该业务是否已经进入衰退期,如果已经进入衰退期,本公司是否有必要投入资金争夺市场扩大份额?如果竞争者是因为战略转移而不作反应,则可以成为本公司乘虚而入抢占市场的有利时机,攻击战略就易于收到显著效果。
三是竞争者反应迟钝,举棋不定,对于受到攻击之后的可能效果缺乏认识,同时也缺乏做出迅速反应或强烈反应的条件,比如资金不足,等等这类竞争者的一般实力不强,市场开拓能力不强选择这类竞争者作为攻击对象易于取得显著效果2)选择型竞争者选择型竞争者指竞争者只对某些类型的攻击做出反应,而对其他类型的攻击无动于衷企业如果尚不具备与竞争者正面决战的实力,就应当分析竞争者在哪些方面反应敏感,在哪些方面反应不敏感,以制定最为可行的攻击战略,避免引起竞争者强烈反应3)凶狠型竞争者凶狠型竞争者指竞争者对所有的攻击行为都做出迅速而强烈的反应这类竞争者意在警告其他企业最好停止任何攻击选择这类竞争者作为攻击对象必须慎之又慎,除非本公司的实力远在竞争者之上,有把握一举击溃而不畏惧它的凶猛反扑否则,就会损失惨重或者两败俱伤4)随机型竞争者指对竞争攻击的反应具有随机性,有无反应和反应强弱无法根据其以往的情况加以预测此类竞争者大多是实力弱小的企业本公司在具备一定实力的条件下,选择此类竞争者作为进攻对象易于取胜并实现预期效果2、竞争者的其他特征与竞争战略选择企业要攻击的竞争者不外乎下列三类之一1)强竞争者与弱竞争者攻击弱竞争者在提高市场占有率的每个百分点方面所耗费的资金和时间较少,但能力提高和利润增加也较少。
在自身实力强大的条件下,攻击强竞争者可以提高自己的生产、管理和促销能力,更大幅度地扩大市场占有率和利润水平2)近竞争者和远竞争者多数公司重视同近竞争者对抗并力图摧毁对方,但是竞争胜利可能招来更难对付的竞争者美国的战略研究专家波特举了两个毫无意义的“胜利”的例子:鲍希和隆巴公司曾积极同其他软镜头生产商对抗并且取得了很大的成功,导致失败者纷纷把资产卖给露华浓、强生和谢林一普洛夫等较大的公司,使自己面对更强大的竞争者一家橡胶特种用品生产商把另一家橡胶特种用品生产商当作不共戴天的仇敌来攻击并抽走股份,给这家公司造成很大损失,结果几家大型轮胎公司的特种用品部门乘虚而入,很快打入了特种橡胶制品市场,倾销产品3)“良性”竞争者与“恶性”竞争者良性”竞争者的特点是:遵守行业规则;对行业增长潜力提出切合实际的设想;按照成本合理定价;喜爱健全的行业,把自己限制在行业的某一部分或某一细分市场中;推动他人降低成本,提高差异化;接受为他们的市场份额和利润规定的大致界限恶性”竞争者的特点是:违反行业规则;企图靠花钱而不,是靠努力去扩大市场份额;敢于冒大风险;生产能力过剩仍然继续投资总之,他们打破了行业平衡公司应支持良性竞争者,攻击恶性竞争者。
更重要的是,竞争者的存在会给公司带来一些战略利益,如增加总需求,导致产品更多的差别,为效率较低的生产者提供了成本保护伞,分摊市场开发成本,服务于吸引力不大的细分市场,减少了违背反托拉斯法的风险等五、 行业未来发展趋势1、分布式系统成为行业技术架构主要的发展方向传统数据库以集中式架构为主,集中式架构由一台或多台主计算机组成中心节点,数据存储以及整个系统的业务单元都集中部署于该中心节点中,系统所有的功能均由中心节点集中处理每个终端或客户端仅仅负责数据的录入和输出,而数据的存储与控制处理完全交由主机完成分布式架构下,软件组件分布在不同主机上,主机之间通过网络连接进行通信和协调随着海量及异构数据的数据分析需求增长,需要的计算、存储和IO等资源也在极速增加集中式架构通过改善硬件配置来提升存储和处理能力,但单台主机可配置的资源存在上限,因此传统的集中式架构软件难以满足海量及异构数据的数据集的处理和分析需求而为了处理TB以及PB级别以上的数据规模,分布式的架构将数据分散在网络上多个通过高速网络互联的节点上联合计算因为数据分布在不同节点,在进行计算任务时,任务也会被切分成多个子任务,分发到多个节点上同时进行计算,能充分利用整个集群各个节点的计算资源、存储资源和IO资源,可线性提升集群的存储和处理能力。
因此,分布式架构能较好的处理该类问题,这也是分布式架构相对于传统单机架构的核心优势在大数据场景下,分布式系统在扩展性、容错性、经济性、灵活性、可用性和可维护性方面具有明显优势,能够较好的满足大数据分析的需求此外,近年来,分布式技术不断发展,在提供高弹性、支持高并发的同时,支持关系型数据库中强事务性的特性,成为大数据技术的重要发展方向2、数据管理软件趋向于统一多数据模型的平台数据模型是决定数据库系统逻辑的重要因素,并从根本上决定以何种方式存储、组织和操作数据,包括传统的关系模型和NoSQL数据模型(文档模型、键值模型、图模型等)大多数数据库管理系统只能支持一种或少数几种数据模型,因此企业通常只能使用多种数据库产品联合的方案来应对日益增长的异构数据模型处理需求随着大数据厂商技术实力的提升,逐渐出现了能够提供多数据库模型的大数据平台技术相比多种数据库产品的集成方案,多种数据库模型统一的大数据平台的优势包括:(1)提升场景效率同一份数据可以分别采用多种数据模型存放,解决不同场景的处理效率问题;(2)统一分析管理关联不同模型的数据,统一分析管理;(3)降低运维成本无需维护多种数据库,降低运维成本;(4)降低数据持有成本,同一份数据在不同的数据模型当中不需要全量存储,不同模型只需要存储必要的数据内容即可,在查询时可以通过关联的方式获取全量信息。
未来多模型数据平台将通过不断提高计算、存储引擎的处理能力,从操作响应速度、数据并发能力、数据管理成本等多个角度优化企业的数据需求,成为多模大数据平台的重要发展趋势3、云原生大数据平台架构成为未来的主要发展方向云原生的代表技术包括容器、服务网格、微服务、不可变基础设施和声明式API,这些技术能够构建容错性好、易于管理和便于观察的松耦合系统结合可靠的自动化手段,云原生技术使工程师能够轻松地对系统作出频繁和可预测的重大变更云原生技术有利于各组织在公有云、私有云和混合云等新型动态环境中,构建和运行可弹性扩展的应用面对客户日益增长的海量数据、多种数据结构的实时化、智能化处理需求,云原生的大数据平台架构凭借计算存储解耦、资源池化、Serverless等核心技术,提供了高弹性拓展、海量存储、多种数据类型处理及低成本计算分析的能力相比传统数据库,云原生数据库及数据管理平台天然具备灵活性,能够提供强大的创新能力、丰富多样的产品体系、经济高效的部署方式和按需付费的支付模式4、国家加速数据要素市场建设,推动数据安全流通技术的商业化加速根据《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》,我国将搭建统一开放、竞争有序的数据要素市场体系,政策鼓励产业链各环节的市场主体进行数据流通和交易,促进数据要素流通。
当前,丰富的数据要素资源已经涵盖了政府、金融、运营商、房地产、医疗、能源、交通、物流、教育以及制造业、电商平台、社交网站等众多领域同时,由于数据的流通和利用是数据要素价值创造的前提而跨域、跨中心的数据融合计算需求,以及数据要素在开放流通环节中的安全需求(包括“可用不可见”、“可用不可得”、“可用不出域”等),都使得数据的安全可信流通成为数据要素的市场化配置的重要一环,也是各行业数字化转型过程中和过程后的必由之路随着《数据安全法》、《个人信息保护法》的实施,以安全为前提的数据开放利用将迎来新一轮发展机遇隐私计算是在处理、分析计算数据的过程中保持数据不透明、不泄露、无法被计算方以及其他非授权方获取的一种技术解决方案,能够在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放,应用前景和商业价值巨大在国家加速数据要素市场建设和重视数据安全和隐私保护的大背景下,数据安全防护技术、隐私计算技术的应用普及和商业化在加速进行六、 扩大总需求市场领导者占有的市场份额最大,在市场总需求扩大时受益也最多扩大总需求的途径有开发产品的新用户、寻找产品的新用途和增加顾客使用量等一)开发新用户1、转变未使用者转变未使用者,即说服那些尚未使用本行业产品的人开始使用,把潜在顾客转变为现实顾客。
比如,有人担心电淋浴器使用不安全而不愿购买,企业可大力宣传它装有多重,安全保护装置,绝对不会发生意外,将这部分潜在购买者转变为现实购买者有人认为纯水中不含有益矿物质而不愿安装家用纯水机纯水机制造公司可大力宣传人们所需的矿物质主要从日常食物中获取,从饮水中获取的比例可以忽略不计,饮用纯水不会影响身体健康而自来水中虽然含有矿物质但是也可能含有许多污染物质,危害身体健康安装家用纯水机直接饮用纯水更加有益身体健康2、进入新的细分市场“新的细分市场”指该细分市场的顾客使用本行业产品,但是不使用其他细分市场的同类产品和品牌例如,服装市场可以根据性别分为男性和女性两个细分市场,根据年龄不同分为老年、中年、青少年和儿童等不同细分市场,一般而言,女性不会购买男性服装,男性也不会购买女性服装;老年人不会购买青少年时装,青少年也不会购买老年人服装企业在原细分市场的需求饱和后可设法进入新的细分市场,扩大原有产品的适用范围,说服新细分市场的顾客使用本产品例如,青年时装制造公司可通过营销宣传说服中老年人购买年轻人的时装,实现心理上的年轻3、地理扩展地理扩展指寻找尚未使用本产品的地区,开发新的地理市场例如,空调、摩托车等产品在城市市场已经趋于饱和,可着重开发农村市场。
轿车在发达国家已经趋于饱和,可向发展中国家和不发达国家转移二)寻找新用途寻找新用途指在产品原有用途之外找出新用途或新使用方法以增加销售量比如,食品生产者常常在包装上印制多种食用或烹制方法,有冷食、热食、浸泡、炸炒、干食等自行车最初是作为交通工具而走向市场的,在摩托车、汽车普及的条件下,许多人购买自行车是作为健身工具产品的许多新用途往往是顾客在使用中发现的,企业应及时了解和推广这些发现烘焙苏打粉生产企业发现美国一些家庭将该产品作为冰箱除臭剂使用,就通过多种途径广泛宣传这一用途,成功地推动一半的美国家庭采用这一方法三)增加使用量1、提高使用频率企业应设法促使顾客更频繁地使用产品例如,果汁营销人员应说服人们不仅在待客时才饮用果汁,平时也要饮用果汁以增加维生素2、增加每次使用量企业可以设法促使顾客增加每次使用量以扩大产品销售洗发剂生产企业可提示顾客,每次洗发时,洗发剂涂抹两次、冲洗两次比只用一次效果更好洗衣粉包装袋上可说明增加洗衣粉用量则衣服更洁净有的调味品制造商将调味品瓶盖上的小孔略微扩大,销售量就明显增加3、增加使用场所电视机生产企业可以宣传在卧室和客厅等不同房间分别摆放电视机的好处,如观看方便、避免家庭成员选择频道的冲突等。
宣传这是美好生活的需要而不是奢侈或浪费,打破原先只买一台的习惯和“节俭”思想,使有条件的家庭乐于购买两台以上的电视机4、提醒顾客及时更换超过保质期或使用期的产品有的顾客由于节约或者疏忽而继续使用超过保质期或使用期的产品,不仅影响健康或者使用效果,也减少了企业的产品销售企业可以通过及时提醒顾客更换产品而扩大市场需求,包括:提醒顾客注意产品的首次使用时间和应当更换的时间;提醒顾客注意产品当前的性能状况轮胎经营企业在售出轮胎之后的适当时间可以提醒顾客注意轮胎的行驶里程并检查轮胎是否需要更换以保证行车安全吉列剃须刀在反复使用之后,上面的彩条会逐渐褪色,提醒消费者更换以保证荆须的舒适性七、 大数据全生命周期管理阶段1、大数据集成大数据集成包括大数据采集和大数据整合大数据采集主要是通过各种技术手段将分散的海量内容数据(文本、音频、视频等)、行为数据(访问、查询、搜索、会话、表单等)、工业生产数据(传感器数据、监控数据)等从业务系统中收集出来由于大数据本身具有分散、海量、高速、异质的特征,采集难度较大,因此保证数据采集的稳定性、可靠性、高效性、可用性和可扩展性等是主要的技术目标,越来越多的企业开始选用专业的数据采集服务。
大数据整合的目标是将各种分布的、异构的数据源中的数据抽取后,进行清洗、转换,最后加载到数据仓库或数据集市中,作为数据分析处理和挖掘的基础;这个过程常常也被称为ETL(Extract/抽取,Transform/转换,Load/加载),通常ETL占到整个数据仓库开发时间的60%~80%大数据时代,数据整合软件的市场也开始了整体的技术升级,主要解决两个主要技术问题,一是独立的ETL应用服务器的计算能力普遍不足,二是无法处理半结构化和非结构化数据经过几年的技术发展,ETL过程逐步演进为ELT,即数据抽取后直接加载(Load)到大数据平台中,再基于大数据平台的计算能力来实现数据转换(Transform),不再依赖ETL应用服务器做抽取和转化工作,这样可以解决ETL应用服务器的处理能力不足问题,充分利用大数据平台的分布式计算能力提升数据集成的效率和稳定性2、大数据存储和处理大数据存储与处理要用服务器及相关设备把采集到的数据存储起来,使得数据能够被高效地访问和运算由于数据量的爆发式增长,尤其是非结构化数据的大量涌现,传统的单机系统性能出现瓶颈,单纯地提高硬件配置已经难以跟上业务的需求,产生的海量数据没有合适的存储场所,企业被迫放弃大量有价值的数据;数据处理的速度和性能出现瓶颈,业务的深度和广度受到限制。
因此,过去十年间,计算机系统逐步从集中式向分布式架构发展分布式架构及相关技术通过增加服务器的数量来提升系统的处理能力,每个节点都是一个可独立运行的单元,单个节点失效时不会影响应用整体的可用性分布式系统在扩展性、容错性、经济性、灵活性、可用性和可维护性方面具有明显优势3、数据治理根据国际数据管理协会的定义,数据治理是对数据资产管理形式权利和控制的活动集合数据治理是一个管理体系,包括组织、制度、流程和工具,随着集成和存储的数据量增加,数据治理的难度也逐渐增加,牵扯的关联方也越来越多,因此需要一套适合企业的方法论来开展工作业界逐渐形成了DAMA、DCMM等较完整的数据治理体系框架,一般包括制定数据治理战略、定义数据治理工作机制、通过各个业务专题来落实相关数据治理工作内容,并最终落实到数据治理工具上来实现高效持续的数据治理的执行流程具体到数据治理的内容,一般包括元数据管理(包括元数据采集、血缘分析、影响分析等)、数据标准管理(包括标准定义、查询与发布等)、数据质量管理(包括质量规则定义、质量检查、质量报告等)、数据资产管理(包括数据资产编目、数据资产服务、资产审批等)、数据安全管理(包括数据权限管理、数据脱敏、数据加密等)、数据生命周期管理(包括数据归档、数据销毁等)以及主数据管理(包括主数据申请、发布、分发等)这几个主要的部分。
4、数据建模数据建模是构建企业数据仓库、数据湖和数据集市的重要过程,其通过一个业务级别的数据模型设计,将分散在不同数据源中的数据集成在一起,并通过一种面向业务主题的方式将数据分门别类来做重新组织和标准化,形成有明确业务意义的数据形式,统一为数据分析、数据挖掘等提供可用的数据面向业务主题(如客户主题、账户主题等)的数据组织管理方式便于业务人员对数据的理解和综合使用具体到技术层面,数据建模一般包括业务调研、架构设计、数据模型设计、数据库SQL开发与测试、业务集成上线等几个阶段,架构设计是整个工作的核心,一般会面向不同的行业来设计相关行业的逻辑数据模型在数据建模过程中使用的工具主要包括:数据模型设计与管理工具、SQL开发工具、任务调度工具等5、数据分析和挖掘大数据分析和数据挖掘的核心目标是对客观事实规律进行描述、展示和总结、刻画、推广,可以从大量的数据中通过算法来揭示出隐含的、未知的并有潜在价值信息,并对客观规律进行溯源和解释,从而帮助决策者做出正确的预测和决策围绕这个目标,大数据分析和挖掘的手段可以分为模型驱动、数据驱动等,一般通过统计、分析、情报检索、机器学习和专家系统等在内的多种方法来实现这一目标。
现阶段在面对大数据“4V”问题时,大数据分析和数据挖掘工具对传统数据分析和挖掘工具做进一步自动化和智能化;与此同时,近年来深度学习的兴起又为大数据分析提供了新的手段,其做为当前计算机行业的热点研究方向之一,其本质的目标是从大量数据中提取模式和知识,其要处理的对象包括结构化数据、半结构化数据和非结构化数据在内的所有类型数据,例如近年来在视频、语音等非结构化数据的分析需求快速增加,相应的深度学习技术也取得了飞速发展6、数据流通数据流通是按照一定规则,将存储的数据或者数据分析、挖掘得到的信息作为流通对象,从供应方传递到需求方的过程数据流通的具体内容包括可视化的分析报告、面向运营人员的数据标签、面向应用可以直接调用的数据指标API、面向数据分析人员的数据集、面向数据挖掘人员的数据特征、和面向业务建模人员的单方或多方的建模模型等基于数据水印、数据加密和脱敏、隐私计算、联邦学习的数据流通安全技术,可以提高数据流通的完整性和保密性八、 大数据行业发展背景1、大数据时代下传统数据管理软件面临多种挑战近年来随着互联网、移动互联网、物联网、5G等信息通信技术及产业的不断发展,全球数据量呈爆发式增长态势数据作为和土地、资本、劳动力、技术一样的生产要素,在数字经济不断深入发展的过程中,地位愈发凸显。
我国是数据资源大国,IDC研究报告指出,到2020年,中国数据量约12.6ZB,较2015年增长7倍,年复合增长率为124%2025年中国的数据量预计达到48.6ZB,约占全球数据总量的30%数据资源总体呈现出“4V”的特点,即海量的数据规模(Volume)、多样的数据类型(Variety)、价值密度低(Value)、快速的数据流转(Velocity)海量的数据规模指数据量大,包括采集、存储和计算过程中所涉及数据量都非常大大数据的起始计量单位通常是PB(约1,000TB)、EB(约100万TB)或ZB(约10亿TB)多样的数据类型指数据种类和来源多样化,包括结构化、半结构化和非结构化数据,具体表现为关系型数据、日志、音频、视频、文本、图片、地理位置信息等类型数据,多类型的数据对数据的处理能力提出了更高的要求价值密度低指有价值数据所占比例低随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,通过结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代需要解决的重要问题之一快速的数据流转指数据增长速度快,处理速度要求快,时效性要求高例如实时监测场景中,企业需要对物联网设备数据进行实时处理并做出反应;零售电子商务应用类软件将消费者所持的移动设备的地理位置信息和其个人偏好相结合,推送有针对性的促销信息。
这是大数据区别于传统数据使用的显著特征随着信息技术以及实际业务需求的快速发展,传统数据管理软件在处理大数据场景时不能很好适应数据的“4V”特性,面临较多技术挑战因此,传统数据管理软件迫切需要技术革新2、传统集中式软件栈向新兴分布式软件栈演进1970-2000年,数据管理软件主要为集中式架构的关系型数据库,其软件产品具备不可分割性(atomicity)、一致性(consistency)、隔离性(isolation,又称独立性)、持久性(durability)即“ACID”功能特性,占据了数据管理软件的主导地位关系型数据库技术出现在20世纪70年代,经过二十余年的发展,到90年代已经成。