Профайлинг
Sep. 24th, 2020 07:51 pmНатравил сегодня профайлер на непосещённый ранее кусок кода. Профайлер интеловский, из бесплатной версии System Studio.
VTune не показал ничего интересного. Ну да, что-то он на процессорах AMD не умеет, но то, что шифровалка бОльшую часть времени проводит, шифруя, я знал и так. Остальное оказалось в неподконтрольной мне обвязке.
А вот Advisor внезапно показал место вполне в моей зоне контроля, в которое я не ходил, поскольку оно типа одноразовое на установку ключей, и там оказался ад и коровники. Часть коровников я снёс, часть буду сносить завтра.
Самое удивительное, конечно, это то, что рост производительности после оптимизации не привязан к статистике, которую выдают эти утилиты. Точнее, привязан, но странно. Ну ок, я там в одном месте транспонировал массив и получил 10% прироста производительности — вероятно, потому что какой-нибудь хитрый префетчинг в кеш, и теперь ему префетчить меньше. Тут понятно, тут надо или более другой инструмент, или пользоваться этими учиться, профайлер не показывает неоптимальный доступ. А вот там, где был хотспот, профайлер показывал 10% в этом месте, а после расчистки, пусть даже частичной, получилось ускорение на все 20. Не понимаю.
VTune не показал ничего интересного. Ну да, что-то он на процессорах AMD не умеет, но то, что шифровалка бОльшую часть времени проводит, шифруя, я знал и так. Остальное оказалось в неподконтрольной мне обвязке.
А вот Advisor внезапно показал место вполне в моей зоне контроля, в которое я не ходил, поскольку оно типа одноразовое на установку ключей, и там оказался ад и коровники. Часть коровников я снёс, часть буду сносить завтра.
Самое удивительное, конечно, это то, что рост производительности после оптимизации не привязан к статистике, которую выдают эти утилиты. Точнее, привязан, но странно. Ну ок, я там в одном месте транспонировал массив и получил 10% прироста производительности — вероятно, потому что какой-нибудь хитрый префетчинг в кеш, и теперь ему префетчить меньше. Тут понятно, тут надо или более другой инструмент, или пользоваться этими учиться, профайлер не показывает неоптимальный доступ. А вот там, где был хотспот, профайлер показывал 10% в этом месте, а после расчистки, пусть даже частичной, получилось ускорение на все 20. Не понимаю.
no subject
Date: 2020-09-24 05:25 pm (UTC)Какая интересная работа! (А я тут скучаю чот.)
no subject
Date: 2020-09-24 05:32 pm (UTC)