目录
说在前面
大数据时代悄然来临,带来了整个信息技术发展的巨大变革,并深刻影响着社会生产和人们生活的方方面面。全球范围内,世界各国政府也非常重视整个大数据的研究和产业的发展,纷纷把大数据上升为国家战略来加以重点推进,企业和学术机构也纷纷加大技术资金和人员的投入力度,加强对整个大数据关键技术研发应用,从而期望在第三次信息化浪潮中占得先机,引领市场。
大数据可以说已经不是镜中花水中月,它的影响力正在迅速的促进我们社会的各个角度,所到之处,或是颠覆或是提升,都让人们感受到了大数据实实在在的威力。
一、数据的概念
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合,是可识别的、抽象的符号。
数据和信息是两个不同的概念,信息是较为宏观的概念,它由数据的有序排列组合而成,传达给读者某个概念方法等,而数据则是构成信息的基本单位,离散的数据没有任何实用价值。
数据也被成为“未来的石油”。
二、数据类型
数据分为四种类型:文本、图片、音频、视频。
文本文件:是一种由若干字符构成的计算机文件,比如用记事本、写字板、word 等程序生成的文件。
图片:是指由图形图像构成的平面媒体,图片的格式非常多,大体可以分为点阵图和矢量图两类,我们常用的 BMP、JPG 属于点阵图,flash 动画软件生成的 swf 文件以及 photoshop 绘图软件所生成的 psd 等等格式的图形属于矢量图形。
音频:是指存储声音内容的文件,用一定的音频顺序的程序来播放就可以还原以前录下来的声音,音频文件的格式非常多,包括 CD、WAV、MP3 等。
视频:是指各种动态的影像的存储格式,包括 MPEG-4、AVI、DAT等格式都是视频常用的格式。
三、数据组织形式
文件:计算机系统中的很多数据都是以文件形式存在的,比如一个 WORD 文件、一个文本文件、一个网页文件、一个图片文件等。
数据库:数据库已经成为计算机软件开发的基础和核心,数据库在人力资源管理、固定资产管理、制造业管理、电信管理、销售管理、股市管理、图书馆管理、政务管理等领域发挥着至关重要的作用。
人类社会已经经历了层次数据库、网状数据库、关系数据库、NoSQL 数据库,那么到目前为止,关系数据库仍然是目前的主流数据库,大多数商业应用系统都是构建在关系数据库基础之上的。
随着 Web 2.0 的兴起,非结构化数据迅速增加,目前人类社会产生的数字内容中有 90% 是非结构化数据,因此,能够更好支持非结构化数据管理的 NoSQL 数据库应运而生。
如果觉得还不错的话,点赞、收藏、分享哈!!!