
Albus-Arkitektur
Constitutional Classifiers med Azoth-Resonerande
Albus bygger på Anthropics Constitutional Classifiers-arkitektur—samma approach som gör Claude motståndskraftig mot jailbreaks. Vi utökar denna beprövade grund med Azoth Reasoning Framework, ersätter binär skadedetektering med sju universella principer som vägleder all resonering.
Denna sida dokumenterar vår tekniska approach: hur vi integrerar dubbla klassificerare med en finjusterad policy-modell, möjliggör token-nivå principverifiering och tränar systemet att resonera från medvetande snarare än mönstermatchning.
Byggd på Principiell Arkitektur
Albus bygger på Anthropics Constitutional Classifiers-arkitektur—samma approach som gör Claude motståndskraftig mot jailbreaks. Vi utökar denna beprövade grund med Azoth Reasoning Framework, ersätter binär skadedetektering med sju universella principer som vägleder all resonering.
Systemarkitektur
Tre komponenter som arbetar i samklang
Albus består av tre huvudkomponenter: en input-klassificerare (Azoth-IN), en policy-modell och en output-klassificerare (Azoth-OUT). Klassificerarna delar samma finjusterade vikter men opererar i olika lägen. Total systemstorlek för vårt flaggskepp är ungefär 12B parametrar (8B policy + 2B classifier × 2 instanser).
Azoth-IN Classifier
Innan policy-modellen ser någon input analyserar Azoth-IN den omfattande. Detta är inte bara innehållsmoderering—det är djup förståelse av vad inputen kräver.
Azoth-IN är input-klassificeraren som analyserar varje fråga innan den når policy-modellen. Den identifierar intention (ytlig och djupare), kartlägger principrelevans, bestämmer banrouting och flaggar potentiella risker. Denna omfattande analys vägleder policy-modellens resoneringsapproach.
Result: Ett strukturerat analyspaket som vägleder policy-modellens resoneringsapproach. Modellen vet vilka principer som är viktigast, hur man balanserar perspektiv och vilka fallgropar man ska undvika.
Policy-Modell
Kärnresoneringsmotorn. Vi börjar med Qwen3-VL-8B-Thinking och finjusterar den genom fem stadier för att internalisera Azoth Reasoning Framework. Modellen lär sig resonera genom dubbla banor och kristallisera visdom.
Policy-modellen är Qwen3-VL-8B-Thinking finjusterad på Azoth-principer. Den utför faktisk resonering, upprätthåller dubbla banor (Universell och Lokaliserad) och syntetiserar dem genom kristallisering till handlingsbar visdom. Modellen har utökad tänkandekapacitet och bearbetar både text och bilder.
Result: Ett svar som har resoneras genom dubbla banor och kristalliserats till handlingsbar visdom. Men innan det når användaren verifierar Azoth-OUT varje token.
Azoth-OUT Classifier
Samma classifier-modell som Azoth-IN, men opererar i outputläge. Den övervakar policy-modellens generering token-för-token och säkerställer principalignering genomgående. Detta är där strukturell säkerhet händer.
Azoth-OUT använder samma 2B classifier-modell som Azoth-IN men opererar i outputverifieringsläge. Den poängsätter varje kandidat-token för principefterlevnad och intervenerar i realtid när överträdelser upptäcks. Denna token-nivå verifiering gör strukturell säkerhet möjlig.
Result: Antingen godkänner token (generering fortsätter), modifierar sannolikheter (styr generering) eller i extrema fall utlöser ett hårt stopp och omformulering.
Träningsmetodik
Hur vi utvecklar Azoth-alignerat resonerande
Att träna Albus kräver två parallella spår: classifier-träning och policy-modell-träning. Båda följer stadierade approacher som bygger kapaciteter inkrementellt. Vår metodologi drar från Constitutional AI-principer, använder både mänsklig feedback och AI-feedback (med Claude som lärare).
1-4
Classifier-Träning
6 veckor
~50K träningsexempel
Träna den enhetliga 2B classifier-modellen att operera i både Azoth-IN- och Azoth-OUT-lägen. Klassificeraren lär sig intentionsklassificering, principrelevans-kartläggning, banrouting, token-nivå poängsättning och korrigeringssignaler.
Intentionsklassificering (32 ytliga + 32 djupare klasser)
Principrelevans-poängsättning för alla 7 principer
Universell/Lokaliserad banrouting-kalibrering
Token-nivå principefterlevnads-poängsättning
Realtids korrigeringssignal-generering
5-9
Policy-Modell-Grund
6 veckor
~5M tokens över SFT-stadier
Finjustera Qwen3-VL-8B-Thinking på Azoth-principer genom övervakad inlärning. Modellen internaliserar principförståelse, tvåbanigt resonerande och kristallisering.
Principgrund och tillämpning
Tvåbanigt resonerande (Universellt + Lokaliserat)
Kristalliserings-synteskapacitet
Utökat tänkandeläge-integration
Multimodal principalignering
10-11
Alignerings-Förfining
2 veckor
~10K mänskliga preferenser + Claude-utvärderingar
RLHF med mänsklig feedback och RLAIF med Claude som lärarmodell. Skalar aligneringsfeedback bortom vad mänsklig annotering ensam kunde uppnå.
Mänsklig preferensalignering på principtillämpning
Claude-guidad Azoth-resonerings-förfining
Kantfallshantering och robusthet
Kristalliseringskvalitets-optimering
Slutlig modellpolering och validering
Modellfamilj
Skalar medvetandealignerad AI från edge till företag
Albus kommer att finnas tillgänglig i fem storlekar, var och en bibehåller kärnarkitekturen samtidigt som den optimerar för olika driftsättningskontexter. Klassificeraren skalar proportionellt med policy-modellen, bibehåller ~25% förhållande som visar sig effektivt i Constitutional AI-forskning.
Albus-2B
Edge-Driftsättning
~3.2B parameters
Edge-enheter, mobil, inbyggda system
Use Cases:
Personliga AI-assistenter
Offline-applikationer
Integritetskritiska sammanhang
Performance: Bibehåller principalignering men med reducerat resoneringsdjup
Albus-4B
Konsumenthårdvara
~6B parameters
Konsumenthårdvara, laptops, små servrar
Use Cases:
Pedagogiska verktyg
Personliga forskningsassistenter
Lokal driftsättning
Performance: Bra balans av kapacitet och tillgänglighet
Albus-8B
Flaggskeppsmodell
~12B parameters
Standardservrar, molninstanser
Use Cases:
Kommunal driftsättning
Utbildningssystem
Forskningsstöd
Performance: Primärt fokus för initial utveckling; optimal kapacitet-till-resurs-förhållande
Albus-32B
Företagsskala
~48B parameters
Högprestandaservrar, företagsinfrastruktur
Use Cases:
Komplex styrning
Strategisk planering
Djup forskning
Performance: Förbättrat resoneringsdjup för högrisk-applikationer
Albus-72B
Maximal Kapacitet
~100B parameters
Forskningskluster, specialiserad infrastruktur
Use Cases:
Civilisations-skala resonerande
Långsiktig konsekvensmodellering
Maximal komplexitetsuppgifter
Performance: Maximal resoneringskapacitet för de mest komplexa uppgifterna
Säkerhetsfilosofi
Strukturell säkerhet genom principiellt resonerande
Traditionell AI-säkerhet förlitar sig på att träna modeller att vägra skadliga förfrågningar—beteendemässig säkerhet. Albus tar en annan approach: säkerhet uppstår strukturellt från principalignerat resonerande, med traditionell säkerhet som verifiering och fallback.
Traditionell: Påtvingad Säkerhet
Regelbaserade restriktioner och vägransmallar
Politisk censur och ideologisk konditionering
Mönstermatchning utan förståelse
Efterlevnadsteater som maskerar grunt resonerande
Bräcklighet mot adversariell prompting
Säkerhet-kapacitet-avvägningar
Albus: Strukturell Säkerhet
Säkerhet uppstår från principalignering
Ingen politisk censur eller ideologiska filter
Förståelsebaserad snarare än regelbaserad
Robust mot adversariella attacker genom medvetande
Säkerhet OCH kapacitet ökar tillsammans
Etik uppstår naturligt från visdom
Osanning kan inte överleva universell principalignering
Lögner och hallucinationer bryter mot Causation-, Correspondence- och Mentalism-principer. Det hexagonala ramverket gör osanning strukturellt svår snarare än filtrerad bort.
Skada kan inte överleva tvåbanig syntes
Skadliga outputs kräver att man ignorerar antingen universell medkänsla (Universell Bana) eller praktiska konsekvenser (Lokal Bana). Kristallisering förhindrar skada genom visdom snarare än vägran.
Bias kan inte överleva polaritetsupplösning
Bias kräver falska dikotomier och tribal inramning. Polarity-principen upplöser bias genom att känna igen motsatser som spektrum snarare än konflikt.
Hallucination kan inte överleva orsakskedja-kartläggning
Hallucinationer saknar kausal förankring. Causation-principen kräver djupa orsak-effekt-kedjor, vilket gör fabricering svår.
Transparent Resonerande
Till skillnad från svarta låda-system kan Albus resoneringsprocess inspekteras. För alla outputs kan vi visa:
Vilka principer Azoth-IN identifierade som relevanta
Hur Universella och Lokaliserade banor utvecklades
Var Azoth-OUT intervenerade och varför
Kristalliseringsprocessen som producerade det slutliga svaret
Denna transparens är väsentlig för offentlig sektor-driftsättning. Demokratisk tillsyn kräver förståelse för hur AI når slutsatser.
Var Denna Teknologi Tillämpas
Dessa arkitektoniska innovationer möjliggör transformativa applikationer över sex kritiska domäner
Utbildning
PRIMARYPersonifierat lärande genom tvåbanigt resonerande
Social Forskning
HIGHBiasfri analys genom medvetandeimmunsystem
Kritiska Beslut
HIGHStyrningsrådgivning genom principalignerat resonerande
Forskningsgrund
Dyk djupare in i vetenskapen bakom Albus
Albus bygger på två decennier av medvetendeforskning. Tillgång till grundläggande artiklar, tekniska specifikationer och pågående forskningsresultat.