Oracle SQL調(diào)優(yōu)系列之定位生產(chǎn)性能問題方法
1双絮、AWR整體分析
場景:最近遇到緊急生產(chǎn)問題采记,因為數(shù)據(jù)庫鎖表導(dǎo)致業(yè)務(wù)功能不能正常使用,對于這種緊急問題嘀倒,首先要安穩(wěn)心態(tài),然后合理分析問題局冰,可以先從整體出發(fā)测蘑,拿下Oracle AWR報告,進行整體分析康二,需要找出是因為cpu問題帮寻,還是具體哪里的程序?qū)е碌?/p>
2、JVM命令進行監(jiān)控
從整體不能定位到問題赠摇,還是需要配合JVM的調(diào)優(yōu)命令進行排查問題固逗,監(jiān)控是否出現(xiàn)oom的情況?
// 監(jiān)控進程信息
[www@localhost ~]$ top
// 查找具體的線程情況
[www@localhost ~]$ top -H -p PID
// 查看進程id
[www@localhost ~]$ jps -l
//根據(jù)jps拿到的PID獲取堆信息藕帜,然后使用gcviewer等等工具進行分析
[www@localhost ~]$ jmap -dump:format=b,file=heap.hprof PID
// 直接查看程序堆信息
[www@localhost ~]$ jmap -heap PID
// 查看棧信息烫罩,看看是否有程序死鎖的情況
[www@localhost ~]$ jstack PID
gc監(jiān)控工具:MAT、gcviewer洽故,也可以通過在線網(wǎng)站進行分析https://gceasy.io/
3贝攒、拿到鎖表sql
ok,程序排查沒問題时甚,從sql方面進行排查
- 查看是否有鎖表
SELECT object_name, machine, s.sid, s.serial#
FROM gv$locked_object l, dba_objects o, gv$session s
WHERE l.object_id = o.object_id
AND l.session_id = s.sid;
- 釋放數(shù)據(jù)表鎖
// 釋放SESSION SQL:
alter system kill session 'sid, serial#';
ALTER system kill session '23, 1647';
- 查看具體的鎖表sql
select l.session_id sid,
s.serial#,
l.locked_mode,
l.oracle_username,
s.user#,
l.os_user_name,
s.machine,
s.terminal,
a.sql_text,
a.action
from v$sqlarea a, v$session s, v$locked_object l
where l.session_id = s.sid
and s.prev_sql_addr = a.address
order by sid, s.serial#;
4隘弊、修改數(shù)據(jù)庫連接數(shù)
ps:當(dāng)然鎖表也有可能是連接數(shù)不夠
- 查看當(dāng)前的數(shù)據(jù)庫連接數(shù)
select count(*) from v$process ;
- 查看數(shù)據(jù)庫允許的最大連接數(shù)
select value from v$parameter where name ='processes';
- 查看當(dāng)前的session連接數(shù)
select count(*) from v$session
- 查看當(dāng)前并發(fā)連接數(shù)
select count(*) from v$session where status='ACTIVE';
- 修改數(shù)據(jù)最大連接數(shù)
alter system set processes = 500 scope = spfile;
- 重啟關(guān)閉數(shù)據(jù)庫
--關(guān)閉數(shù)據(jù)庫
shutdown immediate;
--重啟數(shù)據(jù)庫
startup;
5、定位慢sql
ok荒适,鎖表問題如果可以定位到梨熙,也要順便排查一下哪些慢SQL,在拖系統(tǒng)性能
- 先查詢哪些用戶在使用
select osuser, a.username, cpu_time/executions/1000000||'s', b.sql_text, machine
from v$session a, v$sqlarea b
where a.sql_address =b.address
order by cpu_time/executions desc;
拿出慢sql:
SELECT SQL_TEXT,
SQL_FULLTEXT,
ELAPSED_TIME,
DISK_READS,
BUFFER_GETS,
EXECUTIONS,
Round(ELAPSED_TIME / EXECUTIONS ,2),
ROUND(DISK_READS / EXECUTIONS, 2),
ROUND(BUFFER_GETS / EXECUTIONS , 2),
ROUND((BUFFER_GETS - DISK_READS) / BUFFER_GETS, 2)
FROM V$SQLAREA
WHERE EXECUTIONS > 0
AND BUFFER_GETS > 0
AND (BUFFER_GETS - DISK_READS) / BUFFER_GETS < 0.8
ORDER BY Round(ELAPSED_TIME / EXECUTIONS ,2) desc;
然后解釋一下這些意義:
Round(ELAPSED_TIME / EXECUTIONS ,2):求每個游標執(zhí)行SQL需要的時間
ROUND(DISK_READS / EXECUTIONS, 2):求每個游標執(zhí)行SQL需要讀磁盤的次數(shù)
ROUND(BUFFER_GETS / EXECUTIONS , 2):求每個游標執(zhí)行SQL需要讀內(nèi)存的次數(shù)
ROUND((BUFFER_GETS - DISK_READS) / BUFFER_GETS, 2) :SQL命中率
然后和同事找到一個問題刀诬,發(fā)現(xiàn)一個業(yè)務(wù)邏輯里主鍵的生成是用數(shù)字加上事務(wù)控制生成的咽扇,在這種情況表就經(jīng)常出現(xiàn)被鎖表的情況
結(jié)合druid的監(jiān)控,然后在阿里druid框架的官網(wǎng)找到如下的wikihttps://github.com/alibaba/druid/wiki/%E8%BF%9E%E6%8E%A5%E6%B3%84%E6%BC%8F%E7%9B%91%E6%B5%8B
發(fā)現(xiàn)公司性能這個監(jiān)控被開起來了,所以一個是因為程序問題质欲,加上框架的使用不當(dāng)树埠,導(dǎo)致的。ok嘶伟,性能問題是一個很花時間的問題怎憋,本博客只進行一些簡單的分享,僅供參考