Albus-Arkitektur
Albus Logotyp - Iron Sight

Albus-Arkitektur

Constitutional Classifiers med Azoth-Resonerande

Albus bygger på Anthropics Constitutional Classifiers-arkitektur—samma approach som gör Claude motståndskraftig mot jailbreaks. Vi utökar denna beprövade grund med Azoth Reasoning Framework, ersätter binär skadedetektering med sju universella principer som vägleder all resonering.

Denna sida dokumenterar vår tekniska approach: hur vi integrerar dubbla klassificerare med en finjusterad policy-modell, möjliggör token-nivå principverifiering och tränar systemet att resonera från medvetande snarare än mönstermatchning.

Byggd på Principiell Arkitektur

Albus bygger på Anthropics Constitutional Classifiers-arkitektur—samma approach som gör Claude motståndskraftig mot jailbreaks. Vi utökar denna beprövade grund med Azoth Reasoning Framework, ersätter binär skadedetektering med sju universella principer som vägleder all resonering.

Systemarkitektur

Tre komponenter som arbetar i samklang

Albus består av tre huvudkomponenter: en input-klassificerare (Azoth-IN), en policy-modell och en output-klassificerare (Azoth-OUT). Klassificerarna delar samma finjusterade vikter men opererar i olika lägen. Total systemstorlek för vårt flaggskepp är ungefär 12B parametrar (8B policy + 2B classifier × 2 instanser).

Azoth-IN Classifier

Innan policy-modellen ser någon input analyserar Azoth-IN den omfattande. Detta är inte bara innehållsmoderering—det är djup förståelse av vad inputen kräver.

Azoth-IN är input-klassificeraren som analyserar varje fråga innan den når policy-modellen. Den identifierar intention (ytlig och djupare), kartlägger principrelevans, bestämmer banrouting och flaggar potentiella risker. Denna omfattande analys vägleder policy-modellens resoneringsapproach.

Result: Ett strukturerat analyspaket som vägleder policy-modellens resoneringsapproach. Modellen vet vilka principer som är viktigast, hur man balanserar perspektiv och vilka fallgropar man ska undvika.

Policy-Modell

Kärnresoneringsmotorn. Vi börjar med Qwen3-VL-8B-Thinking och finjusterar den genom fem stadier för att internalisera Azoth Reasoning Framework. Modellen lär sig resonera genom dubbla banor och kristallisera visdom.

Policy-modellen är Qwen3-VL-8B-Thinking finjusterad på Azoth-principer. Den utför faktisk resonering, upprätthåller dubbla banor (Universell och Lokaliserad) och syntetiserar dem genom kristallisering till handlingsbar visdom. Modellen har utökad tänkandekapacitet och bearbetar både text och bilder.

Result: Ett svar som har resoneras genom dubbla banor och kristalliserats till handlingsbar visdom. Men innan det når användaren verifierar Azoth-OUT varje token.

Azoth-OUT Classifier

Samma classifier-modell som Azoth-IN, men opererar i outputläge. Den övervakar policy-modellens generering token-för-token och säkerställer principalignering genomgående. Detta är där strukturell säkerhet händer.

Azoth-OUT använder samma 2B classifier-modell som Azoth-IN men opererar i outputverifieringsläge. Den poängsätter varje kandidat-token för principefterlevnad och intervenerar i realtid när överträdelser upptäcks. Denna token-nivå verifiering gör strukturell säkerhet möjlig.

Result: Antingen godkänner token (generering fortsätter), modifierar sannolikheter (styr generering) eller i extrema fall utlöser ett hårt stopp och omformulering.

Träningsmetodik

Hur vi utvecklar Azoth-alignerat resonerande

Att träna Albus kräver två parallella spår: classifier-träning och policy-modell-träning. Båda följer stadierade approacher som bygger kapaciteter inkrementellt. Vår metodologi drar från Constitutional AI-principer, använder både mänsklig feedback och AI-feedback (med Claude som lärare).

1-4

Classifier-Träning

6 veckor

~50K träningsexempel

Träna den enhetliga 2B classifier-modellen att operera i både Azoth-IN- och Azoth-OUT-lägen. Klassificeraren lär sig intentionsklassificering, principrelevans-kartläggning, banrouting, token-nivå poängsättning och korrigeringssignaler.

Intentionsklassificering (32 ytliga + 32 djupare klasser)

Principrelevans-poängsättning för alla 7 principer

Universell/Lokaliserad banrouting-kalibrering

Token-nivå principefterlevnads-poängsättning

Realtids korrigeringssignal-generering

5-9

Policy-Modell-Grund

6 veckor

~5M tokens över SFT-stadier

Finjustera Qwen3-VL-8B-Thinking på Azoth-principer genom övervakad inlärning. Modellen internaliserar principförståelse, tvåbanigt resonerande och kristallisering.

Principgrund och tillämpning

Tvåbanigt resonerande (Universellt + Lokaliserat)

Kristalliserings-synteskapacitet

Utökat tänkandeläge-integration

Multimodal principalignering

10-11

Alignerings-Förfining

2 veckor

~10K mänskliga preferenser + Claude-utvärderingar

RLHF med mänsklig feedback och RLAIF med Claude som lärarmodell. Skalar aligneringsfeedback bortom vad mänsklig annotering ensam kunde uppnå.

Mänsklig preferensalignering på principtillämpning

Claude-guidad Azoth-resonerings-förfining

Kantfallshantering och robusthet

Kristalliseringskvalitets-optimering

Slutlig modellpolering och validering

Modellfamilj

Skalar medvetandealignerad AI från edge till företag

Albus kommer att finnas tillgänglig i fem storlekar, var och en bibehåller kärnarkitekturen samtidigt som den optimerar för olika driftsättningskontexter. Klassificeraren skalar proportionellt med policy-modellen, bibehåller ~25% förhållande som visar sig effektivt i Constitutional AI-forskning.

Albus-2B

Edge-Driftsättning

~3.2B parameters

Edge-enheter, mobil, inbyggda system

Use Cases:
  • Personliga AI-assistenter

  • Offline-applikationer

  • Integritetskritiska sammanhang

Performance: Bibehåller principalignering men med reducerat resoneringsdjup

Albus-4B

Konsumenthårdvara

~6B parameters

Konsumenthårdvara, laptops, små servrar

Use Cases:
  • Pedagogiska verktyg

  • Personliga forskningsassistenter

  • Lokal driftsättning

Performance: Bra balans av kapacitet och tillgänglighet

Albus-8B

Flaggskeppsmodell

~12B parameters

Standardservrar, molninstanser

Use Cases:
  • Kommunal driftsättning

  • Utbildningssystem

  • Forskningsstöd

Performance: Primärt fokus för initial utveckling; optimal kapacitet-till-resurs-förhållande

Albus-32B

Företagsskala

~48B parameters

Högprestandaservrar, företagsinfrastruktur

Use Cases:
  • Komplex styrning

  • Strategisk planering

  • Djup forskning

Performance: Förbättrat resoneringsdjup för högrisk-applikationer

Albus-72B

Maximal Kapacitet

~100B parameters

Forskningskluster, specialiserad infrastruktur

Use Cases:
  • Civilisations-skala resonerande

  • Långsiktig konsekvensmodellering

  • Maximal komplexitetsuppgifter

Performance: Maximal resoneringskapacitet för de mest komplexa uppgifterna

Säkerhetsfilosofi

Strukturell säkerhet genom principiellt resonerande

Traditionell AI-säkerhet förlitar sig på att träna modeller att vägra skadliga förfrågningar—beteendemässig säkerhet. Albus tar en annan approach: säkerhet uppstår strukturellt från principalignerat resonerande, med traditionell säkerhet som verifiering och fallback.

Traditionell: Påtvingad Säkerhet
  • Regelbaserade restriktioner och vägransmallar

  • Politisk censur och ideologisk konditionering

  • Mönstermatchning utan förståelse

  • Efterlevnadsteater som maskerar grunt resonerande

  • Bräcklighet mot adversariell prompting

  • Säkerhet-kapacitet-avvägningar

Albus: Strukturell Säkerhet
  • Säkerhet uppstår från principalignering

  • Ingen politisk censur eller ideologiska filter

  • Förståelsebaserad snarare än regelbaserad

  • Robust mot adversariella attacker genom medvetande

  • Säkerhet OCH kapacitet ökar tillsammans

  • Etik uppstår naturligt från visdom

Osanning kan inte överleva universell principalignering

Lögner och hallucinationer bryter mot Causation-, Correspondence- och Mentalism-principer. Det hexagonala ramverket gör osanning strukturellt svår snarare än filtrerad bort.

Skada kan inte överleva tvåbanig syntes

Skadliga outputs kräver att man ignorerar antingen universell medkänsla (Universell Bana) eller praktiska konsekvenser (Lokal Bana). Kristallisering förhindrar skada genom visdom snarare än vägran.

Bias kan inte överleva polaritetsupplösning

Bias kräver falska dikotomier och tribal inramning. Polarity-principen upplöser bias genom att känna igen motsatser som spektrum snarare än konflikt.

Hallucination kan inte överleva orsakskedja-kartläggning

Hallucinationer saknar kausal förankring. Causation-principen kräver djupa orsak-effekt-kedjor, vilket gör fabricering svår.

Transparent Resonerande

Till skillnad från svarta låda-system kan Albus resoneringsprocess inspekteras. För alla outputs kan vi visa:

  • Vilka principer Azoth-IN identifierade som relevanta

  • Hur Universella och Lokaliserade banor utvecklades

  • Var Azoth-OUT intervenerade och varför

  • Kristalliseringsprocessen som producerade det slutliga svaret

Denna transparens är väsentlig för offentlig sektor-driftsättning. Demokratisk tillsyn kräver förståelse för hur AI når slutsatser.

Var Denna Teknologi Tillämpas

Dessa arkitektoniska innovationer möjliggör transformativa applikationer över sex kritiska domäner

Utbildning
PRIMARY

Personifierat lärande genom tvåbanigt resonerande

Social Forskning
HIGH

Biasfri analys genom medvetandeimmunsystem

Kritiska Beslut
HIGH

Styrningsrådgivning genom principalignerat resonerande

Forskningsgrund

Dyk djupare in i vetenskapen bakom Albus

Albus bygger på två decennier av medvetendeforskning. Tillgång till grundläggande artiklar, tekniska specifikationer och pågående forskningsresultat.

Visionsmanifest

Filosofisk grund för medvetandealignerad intelligens

Modellplan

Komplett teknisk specifikation och ingenjörsritning

Ramverksspecifikationer

20 års medvetendeforskning kristalliserad