Add option to adjust job OOM score #363

koct9i · 2024-01-31T17:13:20Z

No description provided.

gritukan · 2024-02-01T11:32:41Z

yt/yt/server/node/exec_node/job.cpp

+    // used in Kubernetes.
+    //
+    // TODO(khlebnikov): Use memory limit dedicated for user jobs cgroup.
+    return MaxOOMScore - (MaxOOMScore * reservedMemory + totalMemory - 1) / totalMemory;


Can't this TODO be easily fixed by taking UserJobs limit from memory usage tracker?

k-pogorelov · 2024-02-07T08:46:55Z

yt/yt/server/node/exec_node/job.cpp

@@ -987,6 +987,24 @@ bool TJob::ResourceUsageOverdrafted() const
    return TResourceHolder::GetResourceUsage().UserMemory > RequestedMemory_;
 }

+i64 TJob::GetOOMScoreAdjustment() const
+{
+    auto totalMemory = Bootstrap_->GetMemoryUsageTracker()->GetTotalLimit();


You should use JobResourceManager->GetResourceLimits() here.

I don't think so. Thist must be common cgroup memory limit for all jobs.
Thiere is no such thing yet.

And more likely this should be part of NodeResouceManager.

Yes, this must be common cgroup memory limit for all jobs. And this limit must be returned by JobResourceManager->GetResourceLimits().

k-pogorelov · 2024-02-07T09:19:40Z

yt/yt/server/node/exec_node/job.cpp

+    // used in Kubernetes.
+    //
+    // TODO(khlebnikov): Use memory limit dedicated for user jobs cgroup.
+    return MaxOOMScore - (MaxOOMScore * reservedMemory + totalMemory - 1) / totalMemory;


I'm not sure it is a suitable formula.
Why does OOMScoreAdjustment decrease from an increase in memory demand?

This formula shifts score up but removes penalty for usage below reserved.

Main effect - task with usage above reserve should have bigger score than task which
usage below reserve, regardless of sizes of these reserves.

This all is better-than-nothing estimation for containers with single big process.

The same logic in k8s: https://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/qos/policy.go

Actual oom-badness (non-normalized score) in kernel:
https://github.com/torvalds/linux/blob/master/mm/oom_kill.c#L201

task oom score ~= tasks memory usage / total memory size + oom score adj

k-pogorelov · 2024-02-15T12:03:58Z

yt/yt/server/node/exec_node/job.cpp

@@ -987,6 +987,24 @@ bool TJob::ResourceUsageOverdrafted() const
    return TResourceHolder::GetResourceUsage().UserMemory > RequestedMemory_;
 }

+i64 TJob::GetOOMScoreAdjustment() const
+{
+    auto totalMemory = Bootstrap_->GetMemoryUsageTracker()->GetTotalLimit();


Yes, this must be common cgroup memory limit for all jobs. And this limit must be returned by JobResourceManager->GetResourceLimits().

Add option to adjust job OOM score

46dd84c

koct9i requested review from gritukan and k-pogorelov January 31, 2024 17:13

gritukan reviewed Feb 1, 2024

View reviewed changes

k-pogorelov requested changes Feb 7, 2024

View reviewed changes

k-pogorelov requested changes Feb 15, 2024

View reviewed changes

koct9i marked this pull request as draft March 5, 2024 11:13

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add option to adjust job OOM score #363

Add option to adjust job OOM score #363

koct9i commented Jan 31, 2024

gritukan Feb 1, 2024

k-pogorelov Feb 7, 2024

koct9i Feb 12, 2024

k-pogorelov Feb 15, 2024

k-pogorelov Feb 7, 2024 •

edited

koct9i Feb 7, 2024

k-pogorelov Feb 15, 2024

Add option to adjust job OOM score #363

Are you sure you want to change the base?

Add option to adjust job OOM score #363

Conversation

koct9i commented Jan 31, 2024

gritukan Feb 1, 2024

Choose a reason for hiding this comment

k-pogorelov Feb 7, 2024

Choose a reason for hiding this comment

koct9i Feb 12, 2024

Choose a reason for hiding this comment

k-pogorelov Feb 15, 2024

Choose a reason for hiding this comment

k-pogorelov Feb 7, 2024 • edited

Choose a reason for hiding this comment

koct9i Feb 7, 2024

Choose a reason for hiding this comment

k-pogorelov Feb 15, 2024

Choose a reason for hiding this comment

k-pogorelov Feb 7, 2024 •

edited