为了在Advisor Roofline图表上进行loopnest / functions聚合,您必须运行“使用CallStacks的Roofline”,如下所述: https://software.intel.com/en-us/articles/roofline-with-callstacks
更具体地说,在命令行的情况下,您必须使用: advixe-cl -collect survey -project-dir MyResults -- MyExecutable advixe-cl -collect tripcounts -flop -stacks -project-dir MyResults -- MyExecutable (NB 的 -stacks 强> 额外的旗帜)。
advixe-cl -collect survey -project-dir MyResults -- MyExecutable advixe-cl -collect tripcounts -flop -stacks -project-dir MyResults -- MyExecutable
完成后,您需要在图表上找到与您的功能相对应的点并“折叠”它。基本上,带有Callstacks的Roofline可以配置Roofline模型/图表的粒度/嵌套级别。 使用“自上而下”视图与Roofline图表并排使用或在展开右侧“roofline call stacks”视图时,使用Callstacks在Roofline上浏览父子点更容易: