本文主要是介绍编码修炼之性能优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文章目录
- 概述
- 明确问题
- 跟踪数据
- 定位
- CPU占用高
- 内存泄漏
- OOM
- 数据库连接
- 分析优化
- 涉及面
- code
- 系统工具
- CPU使用率
- 磁盘使用率
- 网络使用率
- jvm
- jvm监控工具
- jcmd
- jconsole
- jhat
- jstack
- jvisualvm
- sql
性能优化是个很大的命题,后期不断补充
概述
总统思路包括:
明确问题—跟踪数据—定位—分析优化
明确问题
出现的性能问题常包括单点性能问题和并发问题。一般来说,单点问题在并发场景有极大概率同样发生。
JProfiler,或者jcmd进行定位;
抓取线程快照分析耗时
数据库session,process,sql分析器 DBSQLMonitor,
跟踪数据
定位
CPU占用高
抓取现场堆栈
top
top -H 查看cpu占用top线程
printf "%x\n" pid 将pid转成nid
根据nid从线程堆栈中查看top cpu线程信息
内存泄漏
JProfile
JConsole
JCmd jcmd PID GC.class_histogram >> tracelog.log ; jcmd PID Thread.print >> tracelog.log
OOM
数据库连接
获取Session会话状态及执行的SQLScript
Session Dump
分析优化
对于有metrics度量的应用或者通过arthas进行程序定位
参考:
java性能权威指南
涉及面
code
代码的性能优化是个很大的话题,但是要讨论这个话题是和代码质量分不开的。有良好的编程习惯和编码规范是个前提,其他的可以在算法和结构上下下功夫。不过,千万不要忘记解耦哦。
同时,可以使用JMH这要的工具在UT阶段,多分析一下性能瓶颈,线上的可以用arthas查看一下性能,响应时长的问题。
经常要考虑的点:
- 线程同步/锁
- 循环代码优化
- 数据库连接池,以及这些池化资源的线程数,避免大量线程等待
- 内存提前分配,如hashmap
- 字符串拼接
- 位运算提速
千万不要忘记在网络环境中,网络和IO才是限制吞吐量的大头
在代码的编程实践中,“少即是多”是一条至理名言。
要编译的代码越多,等待程序启动所耗费的时间就越长;
要创建和销毁的对象越多,垃圾收集的工作量就越大;
要分配和持有的对象越多,GC的周期就越长;
要从磁盘装载进JVM的类越多,程序启动所花费的时间就越长;
要执行的代码越多,机器硬件缓存的效率就越低;而执行的代码越多,花费的时间就越长。
对于代码层的性能优化,我们可以通过arthas的trace,monitor进行监控判断。如果应用启用了APM这个部分的度量信息会更加直观。
系统工具
CPU使用率
vmstat 1
磁盘使用率
iostat
网络使用率
netstat
jvm
要注意,jvm在性能优化中只占比较小的一部分。
到jvm的优化情况一般比较少,尤其是在微服务开发场景中,我们用的jre镜像大部分是开源官方版或者是公司统一规范的镜像,这一般是架构师处理的,需要程序员实操的机会不太多。但是,如果遇到了这种情况,一般考虑一下几个方面:
- 内存分代
-Xms4G 是指: JVM启动时整个堆(包括年轻代,年老代)的初始化大小。
-Xmx4G 是指: JVM启动时整个堆的最大值。
-Xmn2G是指:年轻代的空间大小,剩下的是年老代的空间。
- 垃圾回收器
-XX:+UseConcMarkSweepGC是指:使用GC的回收类型。这里是CMS类型,JDK1.7以后推荐使用
+UseG1GC,被称为G1类型(或Garbage First)的回收器。
很多情况下是选择提高整个jvm的内存大小。注意jvm参数有不少默认值,实践中这些默认值是否合适,是值得考虑的。
jvm监控工具
jcmd
它用来打印Java进程所涉及的基本类、线程和VM信息
jconsole
提供JVM活动的图形化视图,包括线程的使用、类的使用和GC活动。
jhat
读取内存堆转储,并有助于分析
jstack
提供GC和类装载活动的信息
jvisualvm
监视JVM的GUI工具,可用来剖析运行的应用,分析JVM堆转储(事后活动,虽然jvisualvm也可以实时抓取程序的堆转储)
sql
https://blog.csdn.net/qq_38789941/article/details/83744271
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。
2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:
select id from t where num is null
可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:
select id from t where num=0
如果查询表的数据量较少也会走全表扫描,这种情况要多profile查看一下索引打到哪里了,可空字段不是不能添加索引,这一点要注意
3.应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描。
4.应尽量避免在 where 子句中使用 or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,如:
select id from t where num=10 or num=20
可以这样查询:
select id from t where num=10
union all
select id from t where num=20
5.in 和 not in 也要慎用,否则会导致全表扫描,如:
select id from t where num in(1,2,3)
对于连续的数值,能用 between 就不要用 in 了:
select id from t where num between 1 and 3
6.下面的查询也将导致全表扫描:
select id from t where name like ‘%abc%’ — 要遵循最左查询原则
7.应尽量避免在 where 子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。如:
select id from t where num/2=100
应改为:
select id from t where num=100*2
8.应尽量避免在where子句中对字段进行函数操作,这将导致引擎放弃使用索引而进行全表扫描。如:
select id from t where substring(name,1,3)=‘abc’–name以abc开头的id
应改为:
select id from t where name like ‘abc%’
9.不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算,否则系统将可能无法正确使用索引。
10.在使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用,并且应尽可能的让字段顺序与索引顺序相一致。
11.不要写一些没有意义的查询,如需要生成一个空表结构:
select col1,col2 into #t from t where 1=0
这类代码不会返回任何结果集,但是会消耗系统资源的,应改成这样:
create table #t(…)
12.很多时候用 exists 代替 in 是一个好的选择:
select num from a where num in(select num from b)
用下面的语句替换:
select num from a where exists(select 1 from b where num=a.num)
13.并不是所有索引对查询都有效,SQL是根据表中数据来进行查询优化的,当索引列有大量数据重复时,SQL查询可能不会去利用索引,如一表中有字段sex,male、female几乎各一半,那么即使在sex上建了索引也对查询效率起不了作用。
14.索引并不是越多越好,索引固然可以提高相应的 select 的效率,但同时也降低了 insert 及 update 的效率,
因为 insert 或 update 时有可能会重建索引,所以怎样建索引需要慎重考虑,视具体情况而定。
一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到的列上建的索引是否有必要。
15.尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。
这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符,而对于数字型而言只需要比较一次就够了。
16.尽可能的使用 varchar 代替 char ,因为首先变长字段存储空间小,可以节省存储空间,
其次对于查询来说,在一个相对较小的字段内搜索效率显然要高些。
17.任何地方都不要使用 select * from t ,用具体的字段列表代替“*”,不要返回用不到的任何字段。
18.避免频繁创建和删除临时表,以减少系统表资源的消耗。
19.临时表并不是不可使用,适当地使用它们可以使某些例程更有效,例如,当需要重复引用大型表或常用表中的某个数据集时。但是,对于一次性事件,最好使用导出表。
20.在新建临时表时,如果一次性插入数据量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,
以提高速度;如果数据量不大,为了缓和系统表的资源,应先create table,然后insert。
21.如果使用到了临时表,在存储过程的最后务必将所有的临时表显式删除,先 truncate table ,然后 drop table ,这样可以避免系统表的较长时间锁定。
22.尽量避免使用游标,因为游标的效率较差,如果游标操作的数据超过1万行,那么就应该考虑改写。
23.使用基于游标的方法或临时表方法之前,应先寻找基于集的解决方案来解决问题,基于集的方法通常更有效。
24.与临时表一样,游标并不是不可使用。对小型数据集使用 FAST_FORWARD 游标通常要优于其他逐行处理方法,尤其是在必须引用几个表才能获得所需的数据时。
在结果集中包括“合计”的例程通常要比使用游标执行的速度快。如果开发时间允许,基于游标的方法和基于集的方法都可以尝试一下,看哪一种方法的效果更好。
25.尽量避免大事务操作,提高系统并发能力。
26.尽量避免向客户端返回大数据量,若数据量过大,应该考虑相应需求是否合理。
27.合理规划索引: 驱动表被驱动表相关字段索引,排序字段
28.避免低效写法: 过滤条件出现在表达式或者函数中,合理等价改写
29. 避免因素类型转换
30. 避免不必要开销,结果集最小化
31. 尽量不用触发器
在生产实践中发生过好几次java程序在多次数据库操作导致程序响应缓慢的情况,一般的这样问题可以通过将单个执行的sql语句改为批量发送给数据库,降低数据库连接的资源消耗。但是在强事务场景中慎用。
这篇关于编码修炼之性能优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!