Scrivi paper di ML per NeurIPS/ICML/ICLR: dalla progettazione all'invio.
npx clawhub@latest install research-paper-writingResearch Paper Writing Pipeline è una competenza end-to-end per la produzione di articoli di ricerca ML/AI pronti per la pubblicazione, destinati a NeurIPS, ICML, ICLR, ACL, AAAI e COLM. Copre l'intero ciclo di vita della ricerca—dalla progettazione e dall'esecuzione degli esperimenti, passando per l'analisi statistica, la stesura in LaTeX, la revisione simulata tra pari e la sottomissione finale—come un ciclo iterativo piuttosto che una sequenza lineare. Installalo quando hai bisogno di un agente AI in grado di gestire autonomamente un intero progetto di ricerca, da una base di codice o un'idea fino a un articolo sottomesso.
npx clawhub@latest install research-paper-writingFai clic sul pulsante Installa in cima a questa pagina per la configurazione con un clic
Copre Configurazione del Progetto → Revisione della Letteratura → Progettazione degli Esperimenti → Esecuzione e Monitoraggio → Analisi → Stesura dell'Articolo → Auto-Revisione e Correzione → Preparazione alla Submission come un ciclo iterativo, non una sequenza lineare. I risultati innescano nuovi esperimenti; le revisioni innescano nuove analisi; la skill gestisce questi cicli di feedback in modo esplicito.
Ogni citazione viene recuperata in modo programmatico tramite Semantic Scholar, arXiv e la negoziazione dei contenuti CrossRef DOI — mai generata dalla memoria. Le citazioni non verificabili sono contrassegnate con [CITATION NEEDED] e segnalate allo scienziato, affrontando il noto tasso di errore delle citazioni AI di circa il 40%.
Un ciclo di raffinamento iterativo basato su evidenze (Critico → Autore B → Sintetizzatore → panel Borda con 3 giudici) con parametri validati empiricamente: convergenza k=2, giudici CoT, temperatura 0,8 per gli autori / 0,3 per i giudici. Include una tabella decisionale che mappa il livello del modello e il tipo di attività alla strategia di raffinamento ottimale, oltre a modalità di errore documentate e relative mitigazioni.
Genera N=3–5 recensioni indipendenti con un prompt orientato alla critica negativa, poi le aggrega tramite un ruolo di meta-revisore che modella un Area Chair. Include un passaggio di revisione visiva separato basato su VLM per la qualità delle figure e i problemi di layout, e un passaggio di verifica delle affermazioni tramite un sotto-agente indipendente per prevenire il bias di conferma.
Include modelli pronti all'uso per NeurIPS 2025, ICML 2026, ICLR 2026, ACL, AAAI 2026 e COLM 2025, con un preambolo professionale (microtype, booktabs, siunitx, cleveref, algorithm2e, TikZ, SciencePlots), script di validazione pre-compilazione (chktex, controlli di citazioni/figure/etichette) e un workflow latexdiff per il tracciamento delle revisioni durante la fase di rebuttal.
Progettato per l'agente Hermes: utilizza delegate_task per la redazione parallela delle sezioni e la verifica concorrente delle citazioni, cronjob per il monitoraggio degli esperimenti con un protocollo [SILENT] per sopprimere le notifiche in assenza di modifiche, memory e todo per mantenere uno stato persistente tra le sessioni, e send_message per notifiche asincrone al completamento degli esperimenti.
Partendo da un repository esistente, la competenza esplora il codebase per identificare il contributo, progetta esperimenti che corrispondono a affermazioni specifiche, li esegue con checkpoint incrementali, analizza i risultati con test di significatività statistica, redige un articolo LaTeX completo utilizzando il template della sede target e prepara il pacchetto di sottomissione anonimizzato finale.
Dopo un rifiuto, la competenza converte l'articolo nel formato della nuova sede (incluse le modifiche ai limiti di pagina e le sezioni obbligatorie specifiche della sede), affronta le osservazioni dei revisori nel testo revisionato, genera un PDF con marcatura latexdiff che mostra le modifiche e verifica la nuova sottomissione rispetto alla checklist della sede di destinazione, senza fare riferimento alla precedente sottomissione.
Per i paper che richiedono la valutazione umana come evidenza primaria (ad esempio, i task di generazione ACL), la skill progetta il protocollo di annotazione—tipo di annotatori, scala (comparazione a coppie vs. Likert), dimensione del campione tramite analisi della potenza statistica, selezione della metrica di accordo inter-annotatore, scelta della piattaforma (Prolific, MTurk) e checklist IRB—prima di eseguire gli esperimenti automatizzati, poiché la valutazione umana richiede tipicamente tempi di preparazione più lunghi.
Oltre all'ML empirico, la competenza supporta articoli teorici (struttura teorema/dimostrazione con schizzi di dimostrazione nel testo principale e dimostrazioni complete in appendice), articoli di rassegna (ricerca bibliografica in ampiezza con progettazione di tassonomie), articoli di benchmark (documentazione dei dataset tramite Datasheets for Datasets, prove di validità dei costrutti) e articoli di posizione — ciascuno con struttura e standard di evidenza distinti.
Dipendenze Python (installare tramite pip):
semanticscholar — API di Semantic Scholar per la verifica delle citazioni e la scoperta di articoliarxiv — ricerca tramite API REST di arXiv e recupero dei metadatihabanero — API CrossRef per il recupero da DOI a BibTeXrequests — client HTTP per la negoziazione dei contenuti DOI e le chiamate API generaliscipy, numpy — analisi statistica (test di McNemar, IC con bootstrap, d/h di Cohen)matplotlib — generazione di figureSciencePlots — stili matplotlib di qualità editorialeDipendenze di sistema:
latexmk, chktex e latexdiff per la compilazione, il linting e il tracciamento delle revisionigit per il controllo delle versioni e la cronologia degli esperimentiPiattaforme: Linux, macOS
Toolset Hermes richiesti: terminal, files
Opzionali ma consigliati:
claude mcp add exa -- npx -y mcp-remote "https://mcp.exa.ai/mcp"npx clawhub@latest install research-paper-writingAccedi per scrivere una recensione
Nessuna recensione ancora. Sii il primo a condividere la tua esperienza!