chaiml-2fe5-c13f-linear-w01

developer_uid: chai_backend_admin

submission_id: chaiml-2fe5-c13f-linear-w01_v34

model_name: chaiml-2fe5-c13f-linear-w01_v34

model_group: ChaiML/2fe5-c13f-linear-

status: torndown

timestamp: 2025-12-29T23:01:40+00:00

num_battles: 9710

num_wins: 4973

celo_rating: 1305.22

family_friendly_score: 0.536

family_friendly_standard_error: 0.007052715788970942

submission_type: basic

model_repo: ChaiML/2fe5-c13f-linear-w01

model_architecture: MistralForCausalLM

model_num_parameters: 12772070400.0

best_of: 10

max_input_tokens: 1024

max_output_tokens: 64

reward_model: default

display_name: chaiml-2fe5-c13f-linear-w01_v34

ineligible_reason: num_battles<10000

is_internal_developer: True

language_model: ChaiML/2fe5-c13f-linear-w01

model_size: 13B

ranking_group: single

us_pacific_date: 2025-12-26

win_ratio: 0.5121524201853759

generation_params: {'temperature': 0.9, 'top_p': 1.0, 'min_p': 0.05, 'top_k': 80, 'presence_penalty': 0.0, 'frequency_penalty': 0.0, 'stopping_words': ['<|eot_id|>', 'Bot:', 'You:', '\n', '</s>', 'User:', '<|im_end|>', '####'], 'max_input_tokens': 1024, 'best_of': 10, 'max_output_tokens': 64}

formatter: {'memory_template': "{bot_name}'s Persona: {memory}\n####\n", 'prompt_template': '', 'bot_template': '{bot_name}: {message}\n', 'user_template': '{user_name}: {message}\n', 'response_template': '{bot_name}:', 'truncate_by_message': True}

Resubmit model

Shutdown handler not registered because Python interpreter is not running in the main thread
run pipeline %s
run pipeline stage %s
Running pipeline stage VLLMTemplater
Pipeline stage VLLMTemplater completed in 0.17s
run pipeline stage %s
Running pipeline stage VLLMDeployer
Creating inference service chaiml-2fe5-c13f-linear-w01-v34
Waiting for inference service chaiml-2fe5-c13f-linear-w01-v34 to be ready
Inference service chaiml-2fe5-c13f-linear-w01-v34 ready after 150.6618127822876s
Pipeline stage VLLMDeployer completed in 151.15s
run pipeline stage %s
Running pipeline stage StressChecker
Received healthy response to inference request in 1.3220133781433105s
Received healthy response to inference request in 1.4018747806549072s
Received healthy response to inference request in 1.3273935317993164s
Received healthy response to inference request in 1.3390114307403564s
Received healthy response to inference request in 1.329953670501709s
Received healthy response to inference request in 1.2899250984191895s
Received healthy response to inference request in 1.4001884460449219s
Received healthy response to inference request in 1.2804064750671387s
Received healthy response to inference request in 1.4147758483886719s
Received healthy response to inference request in 1.322446584701538s
Received healthy response to inference request in 1.718804121017456s
Received healthy response to inference request in 1.380507230758667s
Received healthy response to inference request in 1.477238416671753s
Received healthy response to inference request in 1.283674955368042s
Received healthy response to inference request in 1.3464608192443848s
Received healthy response to inference request in 1.366515874862671s
Received healthy response to inference request in 1.2805922031402588s
Received healthy response to inference request in 1.2943241596221924s
Received healthy response to inference request in 1.2920379638671875s
Received healthy response to inference request in 1.3495306968688965s
Received healthy response to inference request in 1.3454911708831787s
Received healthy response to inference request in 1.5416710376739502s
Received healthy response to inference request in 1.2807421684265137s
Received healthy response to inference request in 1.300856590270996s
Received healthy response to inference request in 1.3787055015563965s
Received healthy response to inference request in 1.28749680519104s
Received healthy response to inference request in 1.4234273433685303s
Received healthy response to inference request in 1.3097023963928223s
Received healthy response to inference request in 1.285081148147583s
Received healthy response to inference request in 1.3016953468322754s
30 requests
0 failed requests
5th percentile: 1.2806596875190734
10th percentile: 1.2833816766738892
20th percentile: 1.2894394397735596
30th percentile: 1.298896861076355
40th percentile: 1.3170889854431151
50th percentile: 1.3286736011505127
60th percentile: 1.345879030227661
70th percentile: 1.3701727628707885
80th percentile: 1.4005257129669189
90th percentile: 1.4288084506988525
95th percentile: 1.5126763582229612
99th percentile: 1.6674355268478396
mean time: 1.3557515064875285
Pipeline stage StressChecker completed in 43.06s
run pipeline stage %s
Running pipeline stage OfflineFamilyFriendlyTriggerPipeline
run_pipeline:run_in_cloud %s
starting trigger_guanaco_pipeline args=%s
triggered trigger_guanaco_pipeline args=%s
Pipeline stage OfflineFamilyFriendlyTriggerPipeline completed in 0.56s
Shutdown handler de-registered
chaiml-2fe5-c13f-linear-w01_v34 status is now deployed due to DeploymentManager action
Shutdown handler registered
run pipeline %s
run pipeline stage %s
Running pipeline stage OfflineFamilyFriendlyScorer
Evaluating %s Family Friendly Score with %s threads
Generating Leaderboard row for %s
Generated Leaderboard row for %s
Pipeline stage OfflineFamilyFriendlyScorer completed in 1962.24s
Shutdown handler de-registered
chaiml-2fe5-c13f-linear-w01_v34 status is now torndown due to DeploymentManager action