chaiml-4d70-fd43-linear-w01

developer_uid: richhx

submission_id: chaiml-4d70-fd43-linear-w01_v27

model_name: chaiml-4d70-fd43-linear-w01_v27

model_group: ChaiML/4d70-fd43-linear-

status: torndown

timestamp: 2026-02-07T20:58:44+00:00

num_battles: 6622

num_wins: 3445

celo_rating: 1302.63

family_friendly_score: 0.5092

family_friendly_standard_error: 0.007069870720175865

submission_type: basic

model_repo: ChaiML/4d70-fd43-linear-w01

model_architecture: MistralForCausalLM

model_num_parameters: 12772070400.0

best_of: 8

max_input_tokens: 1800

max_output_tokens: 74

reward_model: default

display_name: chaiml-4d70-fd43-linear-w01_v27

ineligible_reason: model is not deployable

is_internal_developer: True

language_model: ChaiML/4d70-fd43-linear-w01

model_size: 13B

ranking_group: single

us_pacific_date: 2026-01-07

win_ratio: 0.5202355783751133

generation_params: {'temperature': 0.85, 'top_p': 1.0, 'min_p': 0.05, 'top_k': 80, 'presence_penalty': 0.08, 'frequency_penalty': 0.08, 'stopping_words': ['###', '</s>', '<|im_start|>', '\n', '<|im_end|>'], 'max_input_tokens': 1800, 'best_of': 8, 'max_output_tokens': 74}

formatter: {'memory_template': '', 'prompt_template': '', 'bot_template': '{bot_name}: {message}\n', 'user_template': '{user_name}: {message}\n', 'response_template': '{bot_name}:', 'truncate_by_message': True}

Resubmit model

Shutdown handler not registered because Python interpreter is not running in the main thread
run pipeline %s
run pipeline stage %s
Running pipeline stage VLLMTemplater
Pipeline stage VLLMTemplater completed in 0.13s
run pipeline stage %s
Running pipeline stage VLLMDeployer
Creating inference service chaiml-4d70-fd43-linear-w01-v27
Waiting for inference service chaiml-4d70-fd43-linear-w01-v27 to be ready
Inference service chaiml-4d70-fd43-linear-w01-v27 ready after 161.54707765579224s
Pipeline stage VLLMDeployer completed in 162.17s
run pipeline stage %s
Running pipeline stage StressChecker
Received healthy response to inference request in 1.6082639694213867s
Received healthy response to inference request in 1.581188678741455s
Received healthy response to inference request in 1.699953556060791s
Received healthy response to inference request in 1.78718900680542s
Received healthy response to inference request in 1.5190236568450928s
Received healthy response to inference request in 1.5661542415618896s
Received healthy response to inference request in 1.523587703704834s
Received healthy response to inference request in 1.4653596878051758s
Received healthy response to inference request in 1.4615123271942139s
Received healthy response to inference request in 2.24885630607605s
Received healthy response to inference request in 1.5281651020050049s
Received healthy response to inference request in 1.863382339477539s
Received healthy response to inference request in 1.6201844215393066s
Received healthy response to inference request in 1.5134978294372559s
Received healthy response to inference request in 1.547764539718628s
Received healthy response to inference request in 1.450096607208252s
Received healthy response to inference request in 1.6862201690673828s
Received healthy response to inference request in 1.5005910396575928s
Received healthy response to inference request in 1.851924180984497s
Received healthy response to inference request in 1.5418837070465088s
Received healthy response to inference request in 1.463449478149414s
Received healthy response to inference request in 1.8218252658843994s
Received healthy response to inference request in 1.484055519104004s
Received healthy response to inference request in 1.559694766998291s
Received healthy response to inference request in 1.7601399421691895s
Received healthy response to inference request in 1.7064876556396484s
Received healthy response to inference request in 1.4963924884796143s
Received healthy response to inference request in 1.6675505638122559s
Received healthy response to inference request in 1.7042813301086426s
Received healthy response to inference request in 1.526322603225708s
30 requests
0 failed requests
5th percentile: 1.462384045124054
10th percentile: 1.4651686668395996
20th percentile: 1.499751329421997
30th percentile: 1.5222184896469115
40th percentile: 1.5363962650299072
50th percentile: 1.5629245042800903
60th percentile: 1.6130321502685547
70th percentile: 1.6903401851654052
80th percentile: 1.7172181129455568
90th percentile: 1.8248351573944093
95th percentile: 1.8582261681556702
99th percentile: 2.137068855762482
mean time: 1.625166622797648
Pipeline stage StressChecker completed in 51.39s
run pipeline stage %s
Running pipeline stage OfflineFamilyFriendlyTriggerPipeline
run_pipeline:run_in_cloud %s
starting trigger_guanaco_pipeline args=%s
triggered trigger_guanaco_pipeline args=%s
Pipeline stage OfflineFamilyFriendlyTriggerPipeline completed in 0.58s
Shutdown handler de-registered
chaiml-4d70-fd43-linear-w01_v27 status is now deployed due to DeploymentManager action
Shutdown handler registered
run pipeline %s
run pipeline stage %s
Running pipeline stage OfflineFamilyFriendlyScorer
Evaluating %s Family Friendly Score with %s threads
Generating Leaderboard row for %s
Generated Leaderboard row for %s
Pipeline stage OfflineFamilyFriendlyScorer completed in 2738.37s
Shutdown handler de-registered
chaiml-4d70-fd43-linear-w01_v27 status is now protected due to ABTestQueueItem
chaiml-4d70-fd43-linear-w01_v27 status is now inactive due to ABTestQueueItem
chaiml-4d70-fd43-linear-w01_v27 status is now torndown due to DeploymentManager action