[BUG]: Full table scan scenario check condition #107

ketingli1 · 2023-09-19T08:31:42Z

大表扫描场景里，判断SparkPlanInfo节点是否为扫描节点的逻辑为：node.getNodeName().startsWith("Scan")

但是实际的扫描节点的名称并不是Scan开头，逻辑是否有误？
"children": [{
"children": [],
"metadata": {},
"metrics": [{
"accumulatorId": 21,
"metricType": "sum",
"nodeName": "number of output rows"
}],
"nodeName": "HiveTableScan",
"simpleString": "HiveTableScan [id#6L, plan_type#10], HiveTableRelation dev.data_skew_table_partitioned, org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe, [id#6L, task_pod_name#7, project_id#8L, create_time#9, plan_type#10, deleted#11], [ds#12]"
}],

The text was updated successfully, but these errors were encountered:

zebozhuang · 2023-09-19T08:36:37Z

大表扫描场景里，判断SparkPlanInfo节点是否为扫描节点的逻辑为：node.getNodeName().startsWith("Scan")

但是实际的扫描节点的名称并不是Scan开头，逻辑是否有误？ "children": [{ "children": [], "metadata": {}, "metrics": [{ "accumulatorId": 21, "metricType": "sum", "nodeName": "number of output rows" }], "nodeName": "HiveTableScan", "simpleString": "HiveTableScan [id#6L, plan_type#10], HiveTableRelation dev.data_skew_table_partitioned, org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe, [id#6L, task_pod_name#7, project_id#8L, create_time#9, plan_type#10, deleted#11], [ds#12]" }],

可以提供完整的一点eventlog？或者dag graph截图？

ketingli1 · 2023-09-19T08:41:25Z

spark event log日志文件
application_1693822918548_1324.log

zebozhuang · 2023-09-19T08:42:16Z

application_1693822918548_1324.log

我们看下

ketingli1 · 2023-09-20T01:36:20Z

您好，有结论吗

zebozhuang · 2023-09-20T01:47:44Z

您好，有结论吗

这个应该是另个扫描表节点，没有包括在内的，应该是要支持起来的，你们可以提个pull request补充这个逻辑吗？

zebozhuang · 2023-09-20T02:23:39Z

您好，有结论吗

另外，抱歉，昨天加错解析json包，比较晚看到结果。这个是通过个spark submit提交的任务吗？看解析plan里面的table可能需要小调整

ketingli1 · 2023-09-21T06:44:16Z

对，是spark submit提交的，还需要我提个pull request吗？

zebozhuang · 2023-09-21T08:09:16Z

对，是spark submit提交的，还需要我提个pull request吗？

可以的，非常欢迎

zebozhuang added optimize Impove the code or documentation feature labels Sep 20, 2023

zebozhuang self-assigned this Sep 21, 2023

zebozhuang changed the title ~~大表扫描场景判断逻辑~~ [BUG]: Full table scan scenario check condition Sep 27, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[BUG]: Full table scan scenario check condition #107

[BUG]: Full table scan scenario check condition #107

ketingli1 commented Sep 19, 2023

zebozhuang commented Sep 19, 2023 •

edited

ketingli1 commented Sep 19, 2023 •

edited

zebozhuang commented Sep 19, 2023

ketingli1 commented Sep 20, 2023

zebozhuang commented Sep 20, 2023 •

edited

zebozhuang commented Sep 20, 2023

ketingli1 commented Sep 21, 2023

zebozhuang commented Sep 21, 2023

[BUG]: Full table scan scenario check condition #107

[BUG]: Full table scan scenario check condition #107

Comments

ketingli1 commented Sep 19, 2023

zebozhuang commented Sep 19, 2023 • edited

ketingli1 commented Sep 19, 2023 • edited

zebozhuang commented Sep 19, 2023

ketingli1 commented Sep 20, 2023

zebozhuang commented Sep 20, 2023 • edited

zebozhuang commented Sep 20, 2023

ketingli1 commented Sep 21, 2023

zebozhuang commented Sep 21, 2023

zebozhuang commented Sep 19, 2023 •

edited

ketingli1 commented Sep 19, 2023 •

edited

zebozhuang commented Sep 20, 2023 •

edited