你的位置:首页 > 数据库

[数据库]积累一下SQL


开篇先自我检讨一下,写了博客几年以来首次试过连续两个月没出过博文,有客观也有主观原因,但是最近这年里博文数量也越来越少,博文的质量也每况日下。希望自己一直能坚持下来,多写写博文,这月尽量多写几篇来弥补上两个月的。

话说我们的DBA妹子离开我们也两月了。在DBA不在的日子里,小伙伴只能靠自己了。但貌似我的数据库技术还是定格在她离开的时候。

动态SQL

她当时教我最厉害的一招利用SQL生成SQL最终执行查询,大致就是通过sys.table查出表名,生成SQL并合并,最后exec执行。感觉还是比较有用。假设数据库中有一堆命名规范且结构相似的表,要查出这批表的数据,就可以考虑一下用这样的方式

首先从把表名查出来

SELECT name FROM sys.tables WHERE name like '%表名的模式%' AND type= 'U'

 

上面的通配符什么的就不说了,接下来就是要把查询数据的SQL语句拼接出来了。原来还可以这样用,看来以前是没开窍或者是太老实了。

SELECT ' UNION SELECT * FROM '+ name FROM sys.tables WHERE name like '%表名的模式%' AND type='U'

 

这样查询出来的结果就是最终SQL的半成品。但上面我觉得尽量不要用*,这里有表的结构不一样,UNION就会出错了。接下来还需要经过组合和截取,这里就用到了两个函数,一个是 FOR PATH(''),另一个是stuff(),顺序是先让上面的结果合并成一个字符串,再去截取。SQL就成下面的样子

DECLARE @sql varchar(max)SET @sql= SELECT ' UNION SELECT * FROM '+ name FROM sys.tables WHERE name like '%表名的模式%' AND type='U' FOR '')Set @sql=stuff(@sql,1,7,' ')Select @sql

 

这样就可以把SQL语句显示出来了,需要执行的话只需要exec(@sql)就可以了。

这样语句不光可以用于查询数据,加入我要批量删除某一类的表 这样的操作也可以,但有个弊端,就是varchar(max)的容量有限,假如表或者语句太大,varchar(max)放不下的话,最终执行的SQL肯定达不到效果啦!

关联子查询

在上一家公司里面,彬哥教导我们,不要用子查询,会让查询速度变慢的,但是这位DBA教我用了联表子查询,原本的子查询放在FORM子句中;DBA教导的是把子查询放到JOIN子句中,当我提到说影响效率,DBA说不会,我也不明白了。这种语句说应用场景也比较多,我举个例子。

假如现在有一张成绩表,需要查询每个同学去除他整个学期所有测试中最高和最低分的结果,这种情况,关联的子查询适合了

SELECT a.* FROM Exam AS a LEFT JOIN(SELECT [name],MAX(score) AS MaxScore,MIN(score) AS MinScore FROM Exam GROUP BY [name] HAVING MAX(score)<>MIN(score) ) AS bON a.name=b.name AND a.score<>b.MaxScore AND a.score<>b.MinScoreWHERE b.name IS NOT NULL

 

从下面开始则是个人积累阶段了

去除重复

去除重复会涉及到子查询,但子查询会分在FROM子句关联的子查询和直接在WHERE子句里面。共同点在于把视为重复的若干列先分组把他们的键查出来,然后在另一个查询中把最大或最小的保留,其余的DELETE,又拿Exam(id,name,score,subject)表为例,单科只需要一个成绩,其余的去掉。

DELETE FROM Exam WHERE id NOT IN ( SELECT MIN(id) FROM Exam GROUP BY name,subject )

 

另外一种在FROM子句的关联删除会在联表删除中列出来,假如没有主键,或组合主键不便于值用一个值去唯一标识这一行的,我想到的另一个办法是:建临时表#temptable,然后INSERT #temptable SELECT DESTINCT ,接着把原表删除,最后把临时表的数据INSERT去原表并把临时表删掉就得了,这个用在大数据量不知是否会合适。

联表更新

联表更新只是很基本的SQL语法而已,只是鄙人基本功不够扎实,就记录一下

UPDATE a SET a.value=b.monvalue WHERE table1 AS a INNER JOIN table2 AS B ON a.id=b.id WHERE …….

 

在这里顺便几下SQLite的

UPDATE table1 SET value=(SELECT monvalue FROM table2 where id=table1.id )

 

还有MySQL的

UPDATE table1 AS a,table2 AS b SET a.value=b.monvalue WHERE a.id=b.id

 

联表删除

与上面说的删除重复数据相照应,直接上SQL

DELETE a FROM Exam AS a LEFT JOIN ( SELECT MIN(id) FROM Exam GROUP BY name,subject ) AS b ON a.id=b.id WHERE b.id IS NULL

 

Case when

Case when 实际上有两种格式,简单一点的是case函数形式,如下面情况

Case sexWhen '1' THEN '男'WHEN '2' THEN '女'ELSE '其他' END

 

另外一种形式叫case搜索函数,就像下面这样子

Case when sex='1' THEN ''When sex='2' THEN '女'ELSE '其他' END

 

个人认为case when 在查询中实现了分支判断的效果,单纯从外观语法上case函数形式会简介,但从效果来说case函数适合于分支判定是离散的值时适合;case搜索函数是适合于一定的范围,或者说自由度更广的一些判定条件,当然这个也包含了离散的值这个状况。但是case 搜索函数在判定好一个条件符合之后则会屏蔽后面合适的条件。像下面这条语句是能分清各个成绩的等级的

SELECT *,CASEWHEN score >90 THEN '优秀'WHEN score>80 THEN '良好'WHEN score>60 THEN '合格'ELSE '不合格' END FROM Exam

 

但是下面就只有合格与不合格两种等级了

SELECT *,CASEWHEN score>60 THEN '合格'WHEN score>80 THEN '良好'WHEN score >90 THEN '优秀'ELSE '不合格' END FROM Exam

 

之前鄙人一直在写case when … is null 这样的语句,老是不断尝试看语法又没出错,区分好case函数和case 搜索函数之后就明白,该用case when … is null 而不是case … when is null这样了。

行转列

现在数据库里面的表老是说横向表,纵向表,横向表就例如下面的表结构SubjectTest(id,name,subject,score)。假如要展示的结果是(学生,语文,数学,英语)这样的结果时则需要用到行转列

行转列有用到上面case when语句,大概是先把记录按姓名去分组,然后从分组中把各个分数用case分离出来,再用聚集函数求最值或者是求和,语句就这样子

select name, MAX( CASE [subject] WHEN '语文' THEN [score] ELSE 0 END ) AS '语文',MAX( CASE [subject] WHEN '数学' THEN [score] ELSE 0 END ) AS '数学',MAX( CASE [subject] WHEN '英语' THEN [score] ELSE 0 END ) AS '英语',SUM([score]) AS '总分',AVG([score]) AS '平均分'FROM SubjectTestGROUP BY [name]

 

原来也就这么一回事,当科目多了,MAX除了要多写几次外,还可以用用DBA妹子教的SQL拼凑生成把语句生成出来在执行,可惜视图View不支持这样子,唉!

在SQL Server 2005以上有另外一种方式pivot,直接上语句

SELECT * FROM subjecttest PIVOT( SUM(score) FOR [subject] IN( 语文,数学,英语 ) ) a

 

我很奇怪网上说的结果都是合并好的,而我的结果却是这个样子

有行转列,也会有列转行,不过这个更没意思,但顺带也说说UNPIOVT

select name,'语文',语文 as score FROM SubjectTestUNION ALLselect name,'数学',数学 as score FROM SubjectTestUNION ALLselect name,'英语',英语 as score FROM SubjectTest

 

 

SELECT * FROM subjecttest UNPIVOT ( score for [subject] IN (语文,数学,英语) ) a

 

Month year day 函数

这几个函数用于求日期的相应部分,顾名思义是月份,年份,天数

DECLARE @testTimePoint DateTimeSET @testTimePoint='2015-10-23'SELECT YEAR(@testTimePoint) AS 年,MONTH(@testTimePoint) AS 月,DAY(@testTimePoint) AS 日 

Cast函数

Cast函数用于作为数据类型转换,使用它有三点要注意

(1)两个表达式的数据类型完全相同。;

(2)两个表达式可隐性转换。

(3)必须显式转换数据类型。

 

像下面这样子是会报错的

SELECT CAST('12.3' AS int)

因为'12.3'只能转到浮点数,不能转成整形,但是浮点数能转成整形,要让它能成功转,就得这样子

SELECT CAST( CAST('12.3' AS Float) AS Int)

 

写完这篇博文后,我发现比之前DBA走的时候,长进了一点点了。我只是想当一名合格的程序员。