CI Failure (timeout on partition move) in `NodesDecommissioningTest.test_decommissioning_rebalancing_node` #13522

VladLazar · 2023-09-18T17:08:00Z

https://buildkite.com/redpanda/redpanda/builds/37054

Module: rptest.tests.nodes_decommissioning_test
Class: NodesDecommissioningTest
Method: test_decommissioning_rebalancing_node
Arguments: {
    "shutdown_decommissioned": true
}

test_id:    NodesDecommissioningTest.test_decommissioning_rebalancing_node
status:     FAIL
run time:   67.334 seconds

TimeoutError('')
Traceback (most recent call last):
  File "/usr/local/lib/python3.10/dist-packages/ducktape/tests/runner_client.py", line 184, in _do_run
    data = self.run_test()
  File "/usr/local/lib/python3.10/dist-packages/ducktape/tests/runner_client.py", line 269, in run_test
    return self.test_context.function(self.test)
  File "/usr/local/lib/python3.10/dist-packages/ducktape/mark/_mark.py", line 481, in wrapper
    return functools.partial(f, *args, **kwargs)(*w_args, **w_kwargs)
  File "/root/tests/rptest/services/cluster.py", line 82, in wrapped
    r = f(self, *args, **kwargs)
  File "/root/tests/rptest/tests/nodes_decommissioning_test.py", line 629, in test_decommissioning_rebalancing_node
    wait_until(lambda: self._partitions_moving(node=first_node),
  File "/usr/local/lib/python3.10/dist-packages/ducktape/utils/util.py", line 57, in wait_until
    raise TimeoutError(err_msg() if callable(err_msg) else err_msg) from last_exception
ducktape.errors.TimeoutError

JIRA Link: CORE-2263

The text was updated successfully, but these errors were encountered:

mmaslankaprv · 2023-09-26T13:30:37Z

Fixed with: #13616

vbotbuildovich · 2024-04-10T17:30:13Z

*https://buildkite.com/redpanda/redpanda/builds/47428
*https://buildkite.com/redpanda/redpanda/builds/47609

vbotbuildovich · 2024-04-27T21:14:18Z

*https://buildkite.com/redpanda/redpanda/builds/48383

vbotbuildovich · 2024-05-04T21:14:48Z

*https://buildkite.com/redpanda/redpanda/builds/48698

In the `test_decommissioning_rebalancing_node` test case we check if a node that joined the cluster and have some partitions assigned to it in the process of data rebalancing can be successfully decommissioned. The test was flaky as sometimes all the partition rebalance actions were finished before we validated if rebalance started. Added a condition to make sure that we wait for more data before adding the node to cluster to make sure rebalance will last long enough for the decommission to interrupt it. Fixes: redpanda-data#13522 Signed-off-by: Michał Maślanka <michal@redpanda.com>

In the `test_decommissioning_rebalancing_node` test case we check if a node that joined the cluster and have some partitions assigned to it in the process of data rebalancing can be successfully decommissioned. The test was flaky as sometimes all the partition rebalance actions were finished before we validated if rebalance started. Added a condition to make sure that we wait for more data before adding the node to cluster to make sure rebalance will last long enough for the decommission to interrupt it. Fixes: redpanda-data#13522 Signed-off-by: Michał Maślanka <michal@redpanda.com> (cherry picked from commit eb26708)

VladLazar added kind/bug Something isn't working ci-failure area/replication labels Sep 18, 2023

mmaslankaprv self-assigned this Sep 22, 2023

mmaslankaprv closed this as completed Sep 26, 2023

vbotbuildovich reopened this Apr 10, 2024

michael-redpanda added the team/replication helper for jira sync label Apr 26, 2024

mmaslankaprv added the ci-rca/test CI Root Cause Analysis - Test Issue label May 13, 2024

mmaslankaprv mentioned this issue May 13, 2024

tests: wait for messages before adding a node to cluster #18426

Merged

7 tasks

dotnwat closed this as completed in #18426 May 14, 2024

vbotbuildovich mentioned this issue May 14, 2024

[v23.3.x] CI Failure (timeout on partition move) in NodesDecommissioningTest.test_decommissioning_rebalancing_node #18485

Closed

vbotbuildovich mentioned this issue May 14, 2024

[v24.1.x] CI Failure (timeout on partition move) in NodesDecommissioningTest.test_decommissioning_rebalancing_node #18487

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

CI Failure (timeout on partition move) in `NodesDecommissioningTest.test_decommissioning_rebalancing_node` #13522

CI Failure (timeout on partition move) in `NodesDecommissioningTest.test_decommissioning_rebalancing_node` #13522

VladLazar commented Sep 18, 2023 •

edited by github-actions bot

mmaslankaprv commented Sep 26, 2023

vbotbuildovich commented Apr 10, 2024

vbotbuildovich commented Apr 27, 2024

vbotbuildovich commented May 4, 2024

CI Failure (timeout on partition move) in NodesDecommissioningTest.test_decommissioning_rebalancing_node #13522

CI Failure (timeout on partition move) in NodesDecommissioningTest.test_decommissioning_rebalancing_node #13522

Comments

VladLazar commented Sep 18, 2023 • edited by github-actions bot

mmaslankaprv commented Sep 26, 2023

vbotbuildovich commented Apr 10, 2024

vbotbuildovich commented Apr 27, 2024

vbotbuildovich commented May 4, 2024

CI Failure (timeout on partition move) in `NodesDecommissioningTest.test_decommissioning_rebalancing_node` #13522

CI Failure (timeout on partition move) in `NodesDecommissioningTest.test_decommissioning_rebalancing_node` #13522

VladLazar commented Sep 18, 2023 •

edited by github-actions bot