function_kehub_2024-11-12

developer_uid: chai_backend_admin

submission_id: function_kehub_2024-11-12

model_name: retune_with_base

model_group:

status: torndown

timestamp: 2024-11-12T16:54:15+00:00

num_battles: 16382

num_wins: 9215

celo_rating: 1284.6

family_friendly_score: 0.5846

family_friendly_standard_error: 0.006969115295358515

submission_type: function

display_name: retune_with_base

is_internal_developer: True

ranking_group: single

us_pacific_date: 2024-11-12

win_ratio: 0.5625076303259675

generation_params: {'temperature': 0.9, 'top_p': 0.9, 'min_p': 0.05, 'top_k': 80, 'presence_penalty': 0.5, 'frequency_penalty': 0.5, 'stopping_words': ['\n', '</s>'], 'max_input_tokens': 1024, 'best_of': 8, 'max_output_tokens': 64}

formatter: {'memory_template': "{bot_name}'s Persona: {memory}\n####\n", 'prompt_template': '{prompt}\n<START>\n', 'bot_template': '{bot_name}: {message}\n', 'user_template': '{user_name}: {message}\n', 'response_template': '{bot_name}:', 'truncate_by_message': False}

Resubmit model

Shutdown handler not registered because Python interpreter is not running in the main thread
run pipeline %s
run pipeline stage %s
Running pipeline stage StressChecker
Received healthy response to inference request in 2.3885912895202637s
Received healthy response to inference request in 6.2889299392700195s
Received healthy response to inference request in 3.8701610565185547s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Connection pool is full, discarding connection: %s. Connection pool size: %s
Received healthy response to inference request in 2.531083106994629s
Received healthy response to inference request in 3.0599844455718994s
5 requests
0 failed requests
5th percentile: 2.417089653015137
10th percentile: 2.4455880165100097
20th percentile: 2.5025847434997557
30th percentile: 2.636863374710083
40th percentile: 2.8484239101409914
50th percentile: 3.0599844455718994
60th percentile: 3.3840550899505617
70th percentile: 3.7081257343292235
80th percentile: 4.353914833068848
90th percentile: 5.321422386169434
95th percentile: 5.805176162719726
99th percentile: 6.1921791839599605
mean time: 3.627749967575073
%s, retrying in %s seconds...
Received healthy response to inference request in 4.234712839126587s
Received healthy response to inference request in 4.919668197631836s
Received healthy response to inference request in 4.848949909210205s
Received healthy response to inference request in 6.920840263366699s
Received healthy response to inference request in 4.027039289474487s
5 requests
0 failed requests
5th percentile: 4.068573999404907
10th percentile: 4.110108709335327
20th percentile: 4.193178129196167
30th percentile: 4.35756025314331
40th percentile: 4.603255081176758
50th percentile: 4.848949909210205
60th percentile: 4.877237224578858
70th percentile: 4.90552453994751
80th percentile: 5.319902610778809
90th percentile: 6.120371437072754
95th percentile: 6.520605850219726
99th percentile: 6.8407933807373045
mean time: 4.9902420997619625
%s, retrying in %s seconds...
Received healthy response to inference request in 3.6234397888183594s
Received healthy response to inference request in 4.042762756347656s
Received healthy response to inference request in 2.9385814666748047s
Received healthy response to inference request in 2.5037739276885986s
Received healthy response to inference request in 2.627150535583496s
5 requests
0 failed requests
5th percentile: 2.5284492492675783
10th percentile: 2.5531245708465575
20th percentile: 2.6024752140045164
30th percentile: 2.6894367218017576
40th percentile: 2.814009094238281
50th percentile: 2.9385814666748047
60th percentile: 3.2125247955322265
70th percentile: 3.4864681243896483
80th percentile: 3.7073043823242187
90th percentile: 3.8750335693359377
95th percentile: 3.958898162841797
99th percentile: 4.025989837646485
mean time: 3.147141695022583
Pipeline stage StressChecker completed in 63.07s
run pipeline stage %s
Running pipeline stage OfflineFamilyFriendlyTriggerPipeline
run_pipeline:run_in_cloud %s
starting trigger_guanaco_pipeline args=%s
triggered trigger_guanaco_pipeline args=%s
Pipeline stage OfflineFamilyFriendlyTriggerPipeline completed in 3.13s
Shutdown handler de-registered
function_kehub_2024-11-12 status is now deployed due to DeploymentManager action
Shutdown handler registered
run pipeline %s
run pipeline stage %s
Running pipeline stage OfflineFamilyFriendlyScorer
Evaluating %s Family Friendly Score with %s threads
Pipeline stage OfflineFamilyFriendlyScorer completed in 4842.88s
Shutdown handler de-registered
function_kehub_2024-11-12 status is now inactive due to auto deactivation removed underperforming models
function_kehub_2024-11-12 status is now torndown due to DeploymentManager action