{"payload":{"header_redesign_enabled":false,"results":[{"id":"101081298","archived":false,"color":"#3572A5","followers":3494,"has_funding_file":false,"hl_name":"ikostrikov/pytorch-a2c-ppo-acktr-gail","hl_trunc_description":"PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinfor…","language":"Python","mirror":false,"owned_by_organization":false,"public":true,"repo":{"repository":{"id":101081298,"name":"pytorch-a2c-ppo-acktr-gail","owner_id":1212494,"owner_login":"ikostrikov","updated_at":"2022-05-29T12:40:49.826Z","has_issues":true}},"sponsorable":false,"topics":["reinforcement-learning","deep-learning","deep-reinforcement-learning","pytorch","atari","hessian","second-order","continuous-control","actor-critic","ale","mujoco","proximal-policy-optimization","ppo","advantage-actor-critic","a2c","acktr","natural-gradients","roboschool","kfac","kronecker-factored-approximation"],"type":"Public","help_wanted_issues_count":3,"good_first_issue_issues_count":0,"starred_by_current_user":false}],"type":"repositories","page":1,"page_count":1,"elapsed_millis":76,"errors":[],"result_count":1,"facets":[],"protected_org_logins":[],"topics":null,"query_id":"","logged_in":false,"sign_up_path":"/signup?source=code_search_results","sign_in_path":"/login?return_to=https%3A%2F%2Fgithub.com%2Fsearch%3Fq%3Drepo%253Aikostrikov%252Fpytorch-a2c-ppo-acktr-gail%2B%2Blanguage%253APython","metadata":null,"csrf_tokens":{"/ikostrikov/pytorch-a2c-ppo-acktr-gail/star":{"post":"d6Iy1NhdorKOdKOPslNAoHiVyvkh2n33j9Rj3dihOiAJX6MZnFIxj4tKKGyJqTY7CVfFeDiwIQxZIIek27Tdmg"},"/ikostrikov/pytorch-a2c-ppo-acktr-gail/unstar":{"post":"nlDNeXj5-oblcHf6F1Uik8NR1OVUo5AJeIx21eL-pqV6WRnaA8qND03FnTzk66kjC1y-RWc0itV0Z6Z7ZjynZQ"},"/sponsors/batch_deferred_sponsor_buttons":{"post":"K1__h3BfP27BkTWgxrov1iNhj2DdK84SJ0MgvC9mzPh8tcJoPTSEBaFmPw2fH2ekAuXTgkl9_xTRAo5MhRm__g"}}},"title":"Repository search results"}