一、单表、多表查询
- 基本查询语句及方法
- select
- distinct
- from
- where
- group by
- having
- limit
- 连表
- inner
- left join
- right join
- union
一、单表查询
- 前期表与数据准备
# 创建一张部门表
create table emp(
id int not null unique auto_increment,
name varchar(20) not null,
sex enum('male','female') not null default 'male', #大部分是男的
age int(3) unsigned not null default 28,
hire_date date not null,
post varchar(50),
post_comment varchar(100),
salary double(15,2),
office int, # 一个部门一个屋子
depart_id int
);
# 插入记录
# 三个部门:教学,销售,运营
insert into emp(name,sex,age,hire_date,post,salary,office,depart_id) values
('tank','male',17,'20170301','张江第一帅形象代言部门',7300.33,401,1), # 以下是教学部
('egon','male',78,'20150302','teacher',1000000.31,401,1),
('kevin','male',81,'20130305','teacher',8300,401,1),
('jason','male',73,'20140701','teacher',3500,401,1),
('owen','male',28,'20121101','teacher',2100,401,1),
('jerry','female',18,'20110211','teacher',9000,401,1),
('大饼','male',18,'19000301','teacher',30000,401,1),
('sean','male',48,'20101111','teacher',10000,401,1),
('歪歪','female',48,'20150311','sale',3000.13,402,2),# 以下是销售部门
('丫丫','female',38,'20101101','sale',2000.35,402,2),
('丁丁','female',18,'20110312','sale',1000.37,402,2),
('星星','female',18,'20160513','sale',3000.29,402,2),
('格格','female',28,'20170127','sale',4000.33,402,2),
('张野','male',28,'20160311','operation',10000.13,403,3), # 以下是运营部门
('程咬金','male',18,'19970312','operation',20000,403,3),
('程咬银','female',18,'20130311','operation',19000,403,3),
('程咬铜','male',18,'20150411','operation',18000,403,3),
('程咬铁','female',18,'20140512','operation',17000,403,3);
# PS:如果在windows系统中,插入中文字符,select的结果为空白,可以将所有字符编码统一设置成gbk
- 语法书写与执行顺序
# 在写SQL命令时注意两点:
- 书写顺序
# 查询id是4-5记录的id与名字
- select id,name from emp where id > 3 and id < 6;
# PS:根据现实生活中图书管理员找书的过程:
1. 先知道书在哪个位置;
2. 然后再判断要找的是什么书;
3. 最后再找书本中的第几页
- 执行顺序
- from # 找图书馆
- where # 书在图书馆中的位置
- select # 查找书中的某一页内容
# 注意:执行顺序必须要清楚
查询数据量大时,可以在表后面+ \G 修改现实格式
select * from emp\G 不需要分号
- where约束条件
1.查询id大于等于3小于等于6的数据
select * from emp where id >= 3 and id <=6;
between:两者之间
and:与
select * from emp where id between 3 and 6;
2.查询薪资是20000或18000或17000的数据
select * from emp where salary=20000 or salary=18000 or salary=17000;
in:在什么里
select * from emp where salary in (20000, 18000, 17000);
3.查询员工姓名中包含字母o的员工姓名和薪资
like:模糊匹配
%:匹配0个或多个任意字符
_:匹配一个任意字符
select name, salary from emp where name like "%o%";
4.查询员工姓名是由四个字符组成的员工姓名与薪资
select name, salary from emp where name like"____";
char_length(字段):获取字段长度
select name, salary from emp where char_length(name)=4;
5.查询id小于3或者大于6的数据
select * from emp where id<3 or id >6;
select * from emp where id not between 3 and 6;
6.查询薪资不在20000,18000,17000范围的数据
select * from emp where salary not in (20000,18000,17000);
7.查询岗位描述为空的员工名与岗位名
注意:针对null不能用等于号,只能用is
select name, post from emp where post_comment is null;
select name, post from emp where post_comment is not null; # 不为空
- group by分组
严格模式下只能获取分组字段post数据,无法获取其他字段信息,就好比是进程之间数据隔离,但是可以使用聚合函数来获取
聚合函数:max(最大值)、min(最小值)、sum(求和)、avg(平均值)、count(计数)
1.按部门分组
select post from emp group by post;
2. -获取每个部门的最高工资(max)
select post,max(salary) from emp group by post;
as:起别名,给获取出来的数据字段名,设置别名
select post as "部门",max(salary) as "薪资" from emp group by post;
简写可把as去掉,但不推荐,老老实实的就完事了
- 获取每个部门的最低工资(min)
select post, min(salary) from emp group by post;
- 获取每个部门的平均工资(avg)
select post, avg(salary) from emp group by post;
- 获取每个部门的工资总和(sum)
select post, sum(salary) from emp group by post;
- 获取每个部门的人数(count)
select post, count(name) from emp group by post;
3.查询分组之后的部门名称和每个部门下所有员工的姓名
select post, group_concat(name) from emp group by post;
group_concat():不仅可以获取分组后的某个字段,并且可以对字符串进行拼接
select post, group_concat(name, "_dsb") from emp group by post;
4.concat(不分组时用)拼接字符串达到更好的显示效果 as语法使用
select concat('Name: ', name) as '名字', concat('Sal: ', salary) as '薪资' from emp;
5.补充as语法 即可以给字段起别名也可以给表起
select emp.name as '名字', emp.salary as '薪资' from emp;
6.查询四则运算,求各部门所有员工的年薪
select name, salary * 12 as annual_salary from emp;
- having 过滤
1.having 与 where 语法一样,只不过having需要在 group by 后只使用
2.where 不能使用聚合函数,但是 having 可以
统计各部门年龄在30岁以上的员工平均工资,并且保留平均工资大于10000的部门
select post,avg(salary) from emp where age > 30 group by post having avg(salary) >10000;
- distinct 去重
注意:查询的字段值必须是重复的才有效,只要有一个字段是不重复的就没有效果
select distinct post from emp;
- 执行顺序
- from
- where
- group by
- having
- select
- distinct
- order by 排序
order:排序,对select获取的数据进行排序
1.根据薪资进行升序
select * from emp order by salary; # 默认升序
select * from emp order by salary asc; # 指定升序
select * from emp order by salary desc; # 指定降序
2.根据年龄进行降序
select * from emp order by age desc;
3.先按照age升序,再按照salary降序
select * from emp order by age, salary desc;
4.统计各部门年龄在20岁以上的员工平均工资,并且保留平均工资大于3000的部门,然后对平均工资进行升序
select post, avg(salary) from emp where age > 20 group by post having avg(salary) >
3000 order by avg(salary);
- limit 限制返回结果数量
应用场景:类似于淘宝京东首页的数据展示,每一页有固定的展示数量
1.从第一条开始,获取4条记录
select * from emp limit 4;
2.limit可以有两个参数,参数1是限制的开始位置,参数2是从开始位置展示的数量
select * from emp limit 4,3; # 从第四条开始显示3条信息
3.查询工资最高的人的详细信息
select name from emp order by salary limit 1;
- 正则补充
在编程中,凡是看到reg开头的,基本上都是与正则有关
select * from emp where name regexp "^程.*(金|银|铜|铁)$";
二、多表查询
- 创建表与插入数据准备
建表
create table dep(id int, name varchar(16));
Query OK, 0 rows affected (0.53 sec)
create table emp(id int primary key auto_increment,name varchar(20),sex enum('male','female') not null default 'male',age int,dep_id int);
Query OK, 0 rows affected (0.50 sec)
插入数据
insert into dep values
(200,'技术'),
(201,'人力资源'),
(202,'销售'),
(203,'运营');
insert into emp(name,sex,age,dep_id) values
('tank','male',17,200),
('egon','female',48,201),
('kevin','male',38,201),
('jason','female',28,202),
('owen','male',18,200),
('sean','female',18,204);
PS: 目的是为了更好的管理,表数据都存放在硬盘中,存不是目的,目的是为了取,所以我们将数据从硬盘读到内存中,接下来我们因应该将他们拼成一张表来查询更加合理;
注意: 将拆分的表,再拼接到一起进行查询, 可以通过一张表查另一张表的数据;
- 关联查询
左表的一条记录与右表的一条记录都对应一遍称之为"笛卡尔积"
将所有的数据都对应了一遍,虽然不合理但是其中有合理的数据,现在我们需要做的就是找出合理的数据
1.查询员工以及所在部门的信息(将两张表合并,并且根据id字段去判断)
select * from emp, dep where emp.dep_id = dep.id;
2.查询部门为技术部的员工及部门信息
select * from emp,dep where emp.dep_id = dep.id and dep.name = '技术';
将两张表关联到一起的操作,有专门的对应的方法
1.inner join :内连接:只取两张表有对应关系的记录
select * from emp inner join dep on emp.dep_id = dep.id;
select * from emp inner join dep on emp.dep_id = dep.id and dep.name = '技术';
2.left join :左连接:在内连接的基础上,保留左表没有对应关系的记录
select * from emp left join dep on emp.dep_id = dep.id;
3.right join :右连接:在内连接的基础上,保留右表没有对应关系的记录
select * from emp right join dep on emp.dep_id = dep.id;
4.union: 全连接:在内连接的基础上,保留左右表没有对应关系的记录
select * from emp left join dep on emp.dep_id = dep.id union select * from emp right join dep on emp.dep_id = dep.id;
- 子查询
子查询就是将一个查询语句的返回结果用括号括起来,当做另一个查询语句的条件去用
1.查询部门是技术或者人力资源的员工信息
#先获取技术部和人力资源部的id号,再去员工表里根据前面的id号筛选出符合要求的员工信息
select * from emp where dep_id in (select id from dep where name='技术' or name = '人力资源');
2.每个部门最新入职的员工
# 思路:先查每个部门最新入职的员工,再按照部门对应上联表查询
查第一张emp表
select t1.id, t1.name, t1.hire_date, t1.post, t2.* from emp as t1 inner join (select post, max(hire_date) as max_date from emp group by post) as t2 on t1.post = t2.post where t1.hire_date = t2.max_date;
as:
- 可以给表起别名
- 可以给查出来的虚拟表起别名
- 可以给字段起别名
三、练习
写查询语句的步骤: 先看需要查哪张表,然后看有没有什么限制条件, 再看需要根据什么分组,最后再看需要查看什么字段!
执行顺序:
from --> where --> group by --> select
注意: 聚合函数:
1、只能在group by后(执行顺序)使用
2、若查询语句没有group by,则默认整张表就是一个分组。
1. 查询岗位名以及岗位包含的所有员工名字
2. 查询岗位名以及各岗位内包含的员工个数
3. 查询公司内男员工和女员工的个数
4. 查询岗位名以及各岗位的平均薪资
5. 查询岗位名以及各岗位的最高薪资
6. 查询岗位名以及各岗位的最低薪资
7. 查询男员工与男员工的平均薪资,女员工与女员工的平均薪资
8、统计各部门年龄在30岁以上的员工平均工资
答案
1.select post, group_concat(name) from emp group by post;
2.select post, count(id) from emp group by post;
3.select sex, count(id) from emp group by sex;
4.select post, avg(salary) from emp group by post;
5.select post, max(salary) from emp group by post;
6.select post, min(salary) from emp group by post;
7.select sex, avg(salary) from emp group by sex;
8.select post, avg(salary) from emp where age > 30 group by post;
分结构查询: 先查找所有年龄30岁以上的员工,再根据部门分组查询它们的平均工资;
select * from emp where age > 30;
select post, avg(salary) from emp where age > 30 group by post;
设置严格模式
# 严格模式设置
"""
设置sql_mode为only_full_group_by,意味着以后但凡分组,只能取到分组的依据,
不应该在去取组里面的单个元素的值,那样的话分组就没有意义了,因为不分组就是对单个元素信息的随意获取
"""
show variables like "%mode%";
set global sql_mode="strict_trans_tables,only_full_group_by";