跳至主要內容

查询语句

yczha大约 6 分钟MysqlDatabaseDatabaseMysql

在关系数据库中,最常用的操作就是查询。

基本查询

要查询数据库表的数据,我们使用如下的SQL语句:

SELECT * FROM <表名>

SELECT查询的结果是一个二维表。

条件查询

使用SELECT * FROM <表名>可以查询到一张表的所有记录。但是很多时候并不希望获得所有记录,而是根据条件选择性地获取指定条件的记录。

SELECT语句可以通过WHERE条件来设定查询条件,查询结果是满足查询条件的记录。

例如查询学生表中成绩大于90的学生记录:

SELECT * FROM students WHERE score>=90;

使用AND表示并列条件:

SELECT FROM * students WHERE score>=90 AND gender='F';

使用OR 表示逻辑或:

SELECT FROM * students WHERE score >=90 OR gender ='F';

组合条件使用小括号()包裹:

SELECT FROM * students WHERE (score>=60 AND score<=90) OR gender='F'; 

使用LIKE 表示相似,其中%符号表示任意字符:

SELECT FROM * WHERE name LIKE '小%';

条件运算优先级次序为:NOT > AND > OR

投影查询

使用SELECT * FROM <表名> WHERE <条件>可以选出表中的若干条记录。我们注意到返回的二维表结构和原表是相同的,即结果集的所有列与原表的所有列都一一对应。

如果我们只希望返回某些列的数据,而不是所有列的数据,我们可以用SELECT 列1, 列2, 列3 FROM ...,让结果集仅包含指定列。这种操作称为投影查询。

使用SELECT 列1, 列2, 列3 FROM ...时,还可以给每一列起个别名,这样,结果集的列名就可以与原表的列名不同。它的语法是SELECT 列1 别名1, 列2 别名2 FROM ...

SELECT id pk,name nickname FROM students WHERE score>90;

排序

我们使用SELECT查询时,查询结果集通常是按照id排序的,也就是根据主键排序。如果我们要根据其他条件排序怎么办?可以加上ORDER BY子句。

SELECT id,name,gender score FROM studentd ORDER BY score;

如果要反过来,按照成绩从高到底排序,我们可以加上DESC表示“倒序”:

SELECT id,name,gender score FROM studentd ORDER BY score DESC;

如果score列有相同的数据,要进一步排序,可以继续添加列名。例如,使用ORDER BY score DESC, gender表示先按score列倒序,如果有相同分数的,再按gender列排序:

SELECT id, name, gender, score FROM students ORDER BY score DESC, gender;

默认的排序规则是ASC:“升序”,即从小到大。ASC可以省略。

如果有WHERE子句,那么ORDER BY子句要放到WHERE子句后面。

SELECT id, name, gender, score FROM students WHERE class_id=1 ORDER BY score DESC;

分页查询

使用SELECT查询时,如果结果集数据量很大,放在一个页面显示的话数据量太大,不如分页显示。

这个查询可以通过LIMIT <M> OFFSET <N>子句实现:

SELECT id, name, gender, score FROM students ORDER BY score DESC
LIMIT 3 OFFSET 0;

上述查询LIMIT 3 OFFSET 0表示,对结果集从0号记录开始,最多取3条。

如果要查询第2页,那么我们只需要“跳过”头3条记录,也就是对结果集从3号记录开始查询,把OFFSET设定为3:

SELECT id, name, gender, score FROM students ORDER BY score DESC
LIMIT 3 OFFSET 3;

MySQL中,LIMIT 15 OFFSET 30还可以简写成LIMIT 30, 15

使用LIMIT <M> OFFSET <N>分页时,随着N越来越大,查询效率也会越来越低。

聚合查询

如果我们要统计一张表的数据量,例如,想查询students表一共有多少条记录,难道必须用SELECT * FROM students查出来然后再数一数有多少行吗?

这个方法当然可以,但是比较弱智。对于统计总数、平均数这类计算,SQL提供了专门的聚合函数,使用聚合函数进行查询,就是聚合查询,它可以快速获得结果。

仍然以查询students表一共有多少条记录为例,我们可以使用SQL内置的COUNT()函数查询:

SELECT COUNT(*) boys FROM students WHERE gender='M';

除了COUNT()函数外,SQL还提供了如下聚合函数:

函数说明
SUM计算某一列的合计值,该列必须为数值类型
AVG计算某一列的平均值,该列必须为数值类型
MAX计算某一列的最大值
MIN计算某一列的最小值

要特别注意:如果聚合查询的WHERE条件没有匹配到任何行,COUNT()会返回0,而SUM()AVG()MAX()MIN()会返回NULL

分组

SQL提供了“分组聚合”的功能来实现对多个组别的聚合:

SELECT class_id,COUNT(*) num FROM students GROUP BY class_id;

也可以使用多个列进行分组。例如,我们想统计各班的男生和女生人数:

SELECT class_id, gender, COUNT(*) num FROM students GROUP BY class_id, gender;

跨表查询

SELECT查询不但可以从一张表查询数据,还可以从多张表同时查询数据。查询多张表的语法是:SELECT * FROM <表1> <表2>

SELECT * FROM students, classes;

这种一次查询两个表的数据,查询的结果也是一个二维表,它是students表和classes表的“乘积”,即students表的每一行与classes表的每一行都两两拼在一起返回。结果集的列数是students表和classes表的列数之和,行数是students表和classes表的行数之积。

这种多表查询又称笛卡尔查询,使用笛卡尔查询时要非常小心,由于结果集是目标表的行数乘积,对两个各自有100行记录的表进行笛卡尔查询将返回1万条记录,对两个各自有1万行记录的表进行笛卡尔查询将返回1亿条记录。

上述查询的结果集有两列id和两列name,两列id是因为其中一列是students表的id,而另一列是classes表的id,但是在结果集中,不好区分。要解决这个问题,我们仍然可以利用投影查询的“设置列的别名”来给两个表各自的idname列起别名:

SELECT
    students.id sid,
    students.name,
    students.gender,
    students.score,
    classes.id cid,
    classes.name cname
FROM students, classes;

表名.列名这种方式列举两个表的所有列实在是很麻烦,所以SQL还允许给表设置一个别名,让我们在投影查询中引用起来稍微简洁一点:

SELECT
    s.id sid,
    s.name,
    s.gender,
    s.score,
    c.id cid,
    c.name cname
FROM students s, classes c;

连接查询

连接查询是另一种类型的多表查询。连接查询对多个表进行JOIN运算,简单地说,就是先确定一个主表作为结果集,然后,把其他表的行有选择性地“连接”在主表结果集上。

最常用的一种是内连接INNER JOIN,其原理示意图如下:

SELECT s.id, s.name, s.class_id, c.name class_name, s.gender, s.score
FROM students s
INNER JOIN classes c
ON s.class_id = c.id;

其次有外连接,包括:左连接、右连接和全连接

LEFT/RIGHT/FULL OUTER JOIN