ner-cooccurrence-graphs

Relatório de Extração e Análise — claude-code (restored-src)

Repositório analisado

Estatísticas da extração

Métrica Valor
Arquivos TypeScript 1.888
Arquivos de documentação 0
Total de blocos de texto 78.526
Total de caracteres 18.348.792

Distribuição por tipo de bloco

Tipo Quantidade Descrição
import 16.035 Imports de módulos e pacotes
comment 43.880 Comentários de linha (//)
code 10.550 Classes, interfaces, funções, enums
docstring 8.061 Blocos JSDoc / /* */

Métricas dos grafos de co-ocorrência

NER executado com regex + dicionários (sem spaCy).

Métricas gerais

Métrica Sentença Parágrafo K-chars (500)
Nós 955 1.819 1.812
Arestas 1.152 5.456 4.538
Densidade 0,0025 0,0033 0,0028
Grau médio 2,41 6,00 5,01
Grau máximo 58 214 189
Componentes conectados 180 144 150
Maior componente (%) 49,2% 78,6% 77,0%
Diâmetro 17 9 10
Caminho médio 4,52 3,85 3,98
Clustering médio 0,2213 0,4942 0,4676
Transitividade 0,2055 0,3332 0,2716

Top 10 entidades por grau (parágrafo)

Entidade Tipo Grau
src LIB 214
claude LIB 165
api TECH 154
git TECH 119
anthropic LIB 117
next LIB 101
https TECH 86
powershell CLASS 82
github TECH 71
ink LIB 67

Figuras geradas

Arquivo Conteúdo
figures/degree_dist_sentence.png Distribuição de grau — sentença
figures/degree_dist_paragraph.png Distribuição de grau — parágrafo
figures/degree_dist_k_chars.png Distribuição de grau — k-chars
figures/graph_viz_sentence.png Grafo — sentença (layout de força)
figures/graph_viz_paragraph.png Grafo — parágrafo
figures/graph_viz_k_chars.png Grafo — k-chars
figures/comparison_table.png Tabela comparativa de métricas
figures/centrality_comparison.png Top entidades por centralidade

Análise e insights

1. Estrutura geral

A codebase do Claude Code é altamente modular (16k imports, 1.888 arquivos TS). O volume de comentários (56% dos blocos) indica boa documentação inline — fonte rica para NER de linguagem natural quando spaCy for adicionado.

Tabela comparativa de métricas

2. Comparação entre granularidades

Distribuição de grau por parágrafo

3. Entidades centrais

Top entidades por centralidade

4. Propriedades de rede

Grafo de co-ocorrência por parágrafo

5. Problemas identificados

6. Próximos passos