🍥

Piri's Blog

Let’s strive for AGI.

DRRN

Deep Reinforcement Learning with a Natural Language Action Space

大语言模型强化学习

AutoCoA

Agent models: Internalizing Chain-of-Action Generation into Reasoning models

大语言模型强化学习

Search-R1

Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning

大语言模型强化学习

VAGEN

Training VLM Agents with Multi-Turn Reinforcement Learning

大语言模型强化学习

RAGEN

Understanding Self-Evolution in LLM Agents via Multi-Turn Reinforcement Learning

ICM

Curiosity-driven Exploration by Self-supervised Prediction

CTS-based Pseudocounts

Unifying Count-Based Exploration and Intrinsic Motivation

探索与利用基础

frp + vnc实现内网服务器图形化界面

frp + ssh实现反向代理