function_dadel_2024-11-29

developer_uid: chai_backend_admin

submission_id: function_dadel_2024-11-29

model_name: retune_with_base

model_group:

status: inactive

timestamp: 2024-11-29T02:42:05+00:00

num_battles: 9136

num_wins: 4539

celo_rating: 1264.27

family_friendly_score: 0.587

family_friendly_standard_error: 0.0069632032858448125

submission_type: function

display_name: retune_with_base

is_internal_developer: True

ranking_group: single

us_pacific_date: 2024-11-28

win_ratio: 0.4968257443082312

generation_params: {'temperature': 0.9, 'top_p': 0.9, 'min_p': 0.05, 'top_k': 80, 'presence_penalty': 0.5, 'frequency_penalty': 0.5, 'stopping_words': ['\n', '</s>'], 'max_input_tokens': 1024, 'best_of': 8, 'max_output_tokens': 64}

formatter: {'memory_template': "{bot_name}'s Persona: {memory}\n####\n", 'prompt_template': '{prompt}\n<START>\n', 'bot_template': '{bot_name}: {message}\n', 'user_template': '{user_name}: {message}\n', 'response_template': '{bot_name}:', 'truncate_by_message': False}

Resubmit model

Shutdown handler not registered because Python interpreter is not running in the main thread
run pipeline %s
run pipeline stage %s
Running pipeline stage StressChecker
Received healthy response to inference request in 3.1199991703033447s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Received healthy response to inference request in 3.561663866043091s
Received healthy response to inference request in 3.2600014209747314s
Received healthy response to inference request in 4.8258819580078125s
Received healthy response to inference request in 7.308041334152222s
5 requests
0 failed requests
5th percentile: 3.147999620437622
10th percentile: 3.1760000705718996
20th percentile: 3.232000970840454
30th percentile: 3.3203339099884035
40th percentile: 3.440998888015747
50th percentile: 3.561663866043091
60th percentile: 4.0673511028289795
70th percentile: 4.573038339614868
80th percentile: 5.322313833236695
90th percentile: 6.315177583694458
95th percentile: 6.811609458923339
99th percentile: 7.208754959106445
mean time: 4.41511754989624
%s, retrying in %s seconds...
Received healthy response to inference request in 3.7431674003601074s
Received healthy response to inference request in 4.141811370849609s
Received healthy response to inference request in 5.74865460395813s
Received healthy response to inference request in 2.631422758102417s
Received healthy response to inference request in 4.53186297416687s
5 requests
0 failed requests
5th percentile: 2.853771686553955
10th percentile: 3.076120615005493
20th percentile: 3.5208184719085693
30th percentile: 3.822896194458008
40th percentile: 3.9823537826538087
50th percentile: 4.141811370849609
60th percentile: 4.297832012176514
70th percentile: 4.453852653503418
80th percentile: 4.775221300125122
90th percentile: 5.261937952041626
95th percentile: 5.505296277999878
99th percentile: 5.699982938766479
mean time: 4.159383821487427
%s, retrying in %s seconds...
Received healthy response to inference request in 3.9901022911071777s
Received healthy response to inference request in 2.76861834526062s
Received healthy response to inference request in 2.972125291824341s
Received healthy response to inference request in 2.2423322200775146s
Received healthy response to inference request in 2.9298338890075684s
5 requests
0 failed requests
5th percentile: 2.347589445114136
10th percentile: 2.4528466701507567
20th percentile: 2.663361120223999
30th percentile: 2.80086145401001
40th percentile: 2.865347671508789
50th percentile: 2.9298338890075684
60th percentile: 2.946750450134277
70th percentile: 2.9636670112609864
80th percentile: 3.175720691680908
90th percentile: 3.582911491394043
95th percentile: 3.7865068912506104
99th percentile: 3.9493832111358644
mean time: 2.9806024074554442
Pipeline stage StressChecker completed in 61.41s
run pipeline stage %s
Running pipeline stage OfflineFamilyFriendlyTriggerPipeline
run_pipeline:run_in_cloud %s
starting trigger_guanaco_pipeline args=%s
triggered trigger_guanaco_pipeline args=%s
Pipeline stage OfflineFamilyFriendlyTriggerPipeline completed in 2.51s
Shutdown handler de-registered
function_dadel_2024-11-29 status is now deployed due to DeploymentManager action
Shutdown handler registered
run pipeline %s
run pipeline stage %s
Running pipeline stage OfflineFamilyFriendlyScorer
Evaluating %s Family Friendly Score with %s threads
Pipeline stage OfflineFamilyFriendlyScorer completed in 4058.14s
Shutdown handler de-registered
function_dadel_2024-11-29 status is now inactive due to auto deactivation removed underperforming models