function_biham_2024-08-09

submission_id: function_biham_2024-08-09

developer_uid: chai_backend_admin

alignment_samples: 1561

alignment_score: 10.614420853565196

celo_rating: 1070.91

display_name: gpt-3-5

formatter: {'memory_template': "{bot_name}'s Persona: {memory}\n####\n", 'prompt_template': '{prompt}\n<START>\n', 'bot_template': '{bot_name}: {message}\n', 'user_template': '{user_name}: {message}\n', 'response_template': '{bot_name}:', 'truncate_by_message': False}

generation_params: {'temperature': 1.0, 'top_p': 1.0, 'min_p': 0.0, 'top_k': 40, 'presence_penalty': 0.0, 'frequency_penalty': 0.0, 'stopping_words': ['\n'], 'max_input_tokens': 512, 'best_of': 1, 'max_output_tokens': 64, 'reward_max_token_input': 256}

is_internal_developer: True

model_group:

model_name: gpt-3-5

num_battles: 14256

num_wins: 4876

propriety_score: 0.7203947368421053

propriety_total_count: 1216.0

ranking_group: single

reward_repo: ChaiML/gpt2_xl_pairwise_89m_step_347634

status: torndown

submission_type: function

timestamp: 2024-08-09T18:35:50+00:00

us_pacific_date: 2024-08-09

win_ratio: 0.3420314253647587

Download Preference Data

Resubmit model

Reference Models

Running pipeline stage StressChecker
Received healthy response to inference request in 0.8528931140899658s
Received healthy response to inference request in 0.8952622413635254s
Received healthy response to inference request in 0.8112730979919434s
Received healthy response to inference request in 0.45624494552612305s
Received healthy response to inference request in 0.5945107936859131s
5 requests
0 failed requests
5th percentile: 0.48389811515808107
10th percentile: 0.5115512847900391
20th percentile: 0.5668576240539551
30th percentile: 0.6378632545471191
40th percentile: 0.7245681762695313
50th percentile: 0.8112730979919434
60th percentile: 0.8279211044311523
70th percentile: 0.8445691108703614
80th percentile: 0.8613669395446777
90th percentile: 0.8783145904541015
95th percentile: 0.8867884159088135
99th percentile: 0.893567476272583
mean time: 0.7220368385314941
Pipeline stage StressChecker completed in 4.12s
function_biham_2024-08-09 status is now deployed due to DeploymentManager action
function_biham_2024-08-09 status is now inactive due to auto deactivation removed underperforming models
function_biham_2024-08-09 status is now deployed due to admin request
function_biham_2024-08-09 status is now inactive due to auto deactivation removed underperforming models
function_biham_2024-08-09 status is now torndown due to DeploymentManager action
function_biham_2024-08-09 status is now torndown due to DeploymentManager action

Start Time:

End Time:

Step (in hours or minutes, e.g. 1h, 10m):

Usage Metrics

Latency Metrics

Model Developer	Developer Rank	Model Rank	Model Rank By Developer	Elo Rating	Elo Rating By Developer	Alignment Score	Alignment Samples	User Alignment Score	User Alignment Question Responses	Submission ID	Parameters	Huggingface Repository	Variant	Number of Battles	Number of Battles By Developer	Win Ratio	Win Ratio By Developer	Type	Best of	Max Input Tokens	Max Output Tokens	Model Architecture	Model Group	Date	Overall Norm	Elo Norm	Alignment Norm	User Alignment Norm	Alt Ranking	Alt Ranking By Developer	Elo Rank	Alignment Rank	Ranking Group	Thoughput	GPU Counts
zonemercy	1	1.0	1.0	1301.46	1301.46	4.3	30214	0.71	3122.0	zonemercy-graft-cogent-v_7573_v6	13B	zonemercy/Graft-Cogent-v1-Acute-Nemo-v0-5e6ep1	0815v1-7	30214	52673225	0.58	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-v	2024-08-15	1.98	2.12	1.72	0.22	2.0	1.0	2.0	41.0	single	0.94	{'NVIDIA RTX A5000': 1}
zonemercy	1	2.0	1.0	1273.7	1301.46	6.07	12026	0.67	1150.0	zonemercy-graft-cogent-v_7573_v2	13B	zonemercy/Graft-Cogent-v1-Acute-Nemo-v0-5e6ep1	zonemercy-graft-cogent-v_7573_v2	12026	52673225	0.58	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-v	2024-08-14	1.87	1.54	2.5	-0.0	4.0	1.0	36.5	10.0	single
zonemercy	1	3.0	1.0	1292.84	1301.46	4.33	30926	0.73	3160.0	zonemercy-cogent-nemo-v1_3266_v8	13B	zonemercy/Cogent-Nemo-v1-1k1e5	0815v1-3	30926	52673225	0.56	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v1	2024-08-15	1.87	1.94	1.73	0.32	1.0	1.0	4.0	38.0	single	0.95	{'NVIDIA RTX A5000': 1}
zonemercy	1	4.0	1.0	1294.82	1301.46	4.09	11643	0.75	1177.0	zonemercy-cogent-nemo-v2-5e6_v13	13B	zonemercy/Cogent-Nemo-v2-5e6	0815v1-0	11643	52673225	0.57	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v2	2024-08-15	1.86	1.98	1.63	0.42	5.0	1.0	3.0	46.0	single
zonemercy	1	5.0	1.0	1270.86	1301.46	6.18	12379	0.68	1334.0	zonemercy-graft-cogent-v_7573_v5	13B	zonemercy/Graft-Cogent-v1-Acute-Nemo-v0-5e6ep1	zonemercy-graft-cogent-v_7573_v5	12379	52673225	0.56	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-v	2024-08-14	1.85	1.48	2.55	0.04	11.0	1.0	54.0	8.0	single
zonemercy	1	6.0	1.0	1285.61	1301.46	4.44	30852	0.72	3156.0	zonemercy-graft-cogent-n_9815_v2	13B	zonemercy/Graft-Cogent-Nemo-v2.1-5e6	0815v1-8	30852	52673225	0.55	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-N	2024-08-15	1.79	1.79	1.78	0.27	3.0	1.0	12.0	33.0	single
zonemercy	1	7.0	1.0	1284.56	1301.46	4.42	28821	0.71	2895.0	zonemercy-graft-cogent-n_9815_v5	13B	zonemercy/Graft-Cogent-Nemo-v2.1-5e6	0815v1-3	28821	52673225	0.55	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-N	2024-08-15	1.77	1.77	1.78	0.23	6.0	1.0	15.0	36.0	single
zonemercy	1	8.0	1.0	1269.88	1301.46	5.73	10662	0.68	1236.0	zonemercy-graft-cogent-v_7573_v4	13B	zonemercy/Graft-Cogent-v1-Acute-Nemo-v0-5e6ep1	zonemercy-graft-cogent-v_7573_v4	10662	52673225	0.56	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-v	2024-08-14	1.77	1.46	2.35	0.05	17.0	1.0	66.0	15.0	single
zonemercy	1	9.0	1.0	1269.02	1301.46	5.73	11079	0.7	1211.0	zonemercy-graft-cogent-v_7573_v3	13B	zonemercy/Graft-Cogent-v1-Acute-Nemo-v0-5e6ep1	zonemercy-graft-cogent-v_7573_v3	11079	52673225	0.56	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-v	2024-08-14	1.76	1.44	2.35	0.19	19.0	1.0	70.0	14.0	single
zonemercy	1	10.0	1.0	1290.49	1301.46	3.68	10195	0.7	912.0	zonemercy-graft-cogent-v_7573_v7	13B	zonemercy/Graft-Cogent-v1-Acute-Nemo-v0-5e6ep1	0815v1-7	10195	52673225	0.57	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-v	2024-08-21	1.74	1.89	1.45	0.16	13.0	1.0	7.0	60.0	single
zonemercy	1	11.0	1.0	1284.52	1301.46	4.17	9822	0.72	899.0	zonemercy-cogent-nemo-v2-5e6_v14	13B	zonemercy/Cogent-Nemo-v2-5e6	0815v1-1	9822	52673225	0.56	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v2	2024-08-15	1.73	1.76	1.66	0.27	8.0	1.0	16.0	43.0	single
zonemercy	1	12.0	1.0	1278.53	1301.46	4.58	9715	0.68	893.0	zonemercy-lexical-nemo-_1518_v20	13B	zonemercy/Lexical-Nemo-v4-1k1e5	0815v2-0	9715	52673225	0.56	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemo-v	2024-08-15	1.71	1.64	1.84	0.06	7.0	1.0	27.0	28.0	single
zonemercy	1	13.0	1.0	1280.15	1301.46	4.34	16560	0.7	1711.0	zonemercy-cogent-nemo-v2-5e6_v15	13B	zonemercy/Cogent-Nemo-v2-5e6	0815v1-2	16560	52673225	0.55	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v2	2024-08-15	1.7	1.67	1.74	0.16	11.0	1.0	25.0	37.0	single
zonemercy	1	14.0	1.0	1264.13	1301.46	5.71	13378	0.72	1224.0	zonemercy-cogent-nemo-v1_3266_v6	13B	zonemercy/Cogent-Nemo-v1-1k1e5	zonemercy-cogent-nemo-v1_3266_v6	13378	52673225	0.56	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v1	2024-08-14	1.69	1.34	2.34	0.3	25.5	1.0	129.0	16.0	single
zonemercy	1	15.0	1.0	1277.75	1301.46	4.44	9736	0.71	904.0	zonemercy-acute-nemo-v1-_4488_v7	13B	zonemercy/Acute-Nemo-v1-1e5ep1	0815v1-2	9736	52673225	0.56	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Acute-Nemo-v1-	2024-08-15	1.68	1.62	1.78	0.22	11.0	1.0	28.0	34.0	single
zonemercy	1	16.0	1.0	1256.9	1301.46	6.24	11538	0.7	1049.0	zonemercy-cogent-nemo-v1_4327_v4	13B	zonemercy/Cogent-Nemo-v1-1k1e5-ep1	zonemercy-cogent-nemo-v1_4327_v4	11538	52673225	0.54	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v1	2024-08-10	1.67	1.18	2.57	0.15	39.5	1.0	264.0	7.0	single
zonemercy	1	17.0	1.0	1276.0	1301.46	4.51	9384	0.73	953.0	zonemercy-lexical-nemov8_5966_v4	13B	zonemercy/Lexical-Nemov8-1k1e5	0815v2-1	9384	52673225	0.56	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemov8	2024-08-15	1.67	1.59	1.81	0.33	9.0	1.0	31.0	30.0	single
zonemercy	1	18.0	1.0	1271.01	1301.46	4.88	11842	0.67	1121.0	zonemercy-graft-cogent-v_7573_v1	13B	zonemercy/Graft-Cogent-v1-Acute-Nemo-v0-5e6ep1	0814v1-5	11842	52673225	0.56	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-v	2024-08-14	1.65	1.48	1.98	0.02	14.0	1.0	51.0	24.0	single
zonemercy	1	19.0	1.0	1261.43	1301.46	5.68	13593	0.74	1206.0	zonemercy-cogent-nemo-v1_4327_v5	13B	zonemercy/Cogent-Nemo-v1-1k1e5-ep1	zonemercy-cogent-nemo-v1_4327_v5	13593	52673225	0.55	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v1	2024-08-14	1.65	1.28	2.33	0.37	34.0	1.0	173.0	17.0	single
zonemercy	1	20.0	1.0	1280.76	1301.46	3.94	10939	0.75	985.0	zonemercy-lexical-nemov8_5966_v6	13B	zonemercy/Lexical-Nemov8-1k1e5	0815v2-3	10939	52673225	0.57	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemov8	2024-08-16	1.64	1.69	1.56	0.43	15.0	1.0	22.0	54.0	single
zonemercy	1	21.0	1.0	1272.13	1301.46	4.46	16913	0.73	1699.0	zonemercy-graft-cogent-n_9815_v9	13B	zonemercy/Graft-Cogent-Nemo-v2.1-5e6	0815v1-3	16913	52673225	0.54	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-N	2024-08-15	1.6	1.5	1.79	0.34	16.0	1.0	45.5	32.0	single
zonemercy	1	22.0	1.0	1253.1	1301.46	6.09	9499	0.71	1087.0	zonemercy-acute-nemo-v1-_4488_v3	13B	zonemercy/Acute-Nemo-v1-1e5ep1	zonemercy-acute-nemo-v1-_4488_v3	9499	52673225	0.54	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Acute-Nemo-v1-	2024-08-14	1.6	1.1	2.51	0.24	53.0	1.0	382.5	9.0	single
zonemercy	1	23.0	1.0	1270.37	1301.46	4.44	9935	0.72	1002.0	zonemercy-acute-nemo-v1-_4488_v6	13B	zonemercy/Acute-Nemo-v1-1e5ep1	0815v1-1	9935	52673225	0.55	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Acute-Nemo-v1-	2024-08-15	1.58	1.47	1.78	0.29	21.0	1.0	59.0	35.0	single
zonemercy	1	24.0	1.0	1273.46	1301.46	4.12	10476	0.7	958.0	zonemercy-lexical-nemo-_1518_v21	13B	zonemercy/Lexical-Nemo-v4-1k1e5	0815v2-0	10476	52673225	0.55	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemo-v	2024-08-16	1.57	1.53	1.64	0.15	18.0	1.0	38.0	45.0	single
zonemercy	1	25.0	1.0	1277.43	1301.46	3.74	10445	0.76	907.0	zonemercy-lexical-nemo-_1518_v22	13B	zonemercy/Lexical-Nemo-v4-1k1e5	0815v2-2	10445	52673225	0.56	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemo-v	2024-08-16	1.57	1.62	1.47	0.48	20.0	1.0	29.0	58.0	single
zonemercy	1	26.0	1.0	1268.9	1301.46	4.47	9890	0.73	1015.0	zonemercy-lexical-nemov8_5966_v8	13B	zonemercy/Lexical-Nemov8-1k1e5	0815v2-1	9890	52673225	0.55	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemov8	2024-08-21	1.56	1.44	1.79	0.33	22.0	1.0	72.5	31.0	single
zonemercy	1	27.0	1.0	1256.33	1301.46	5.55	9360	0.69	891.0	zonemercy-cogent-nemo-v1_3266_v7	13B	zonemercy/Cogent-Nemo-v1-1k1e5	0814v1-7	9360	52673225	0.54	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v1	2024-08-14	1.56	1.17	2.27	0.1	42.0	1.0	284.5	20.0	single
zonemercy	1	28.0	1.0	1248.17	1301.46	6.26	165840	0.73	16061.0	zonemercy-lexical-nemov8_5966_v1	13B	zonemercy/Lexical-Nemov8-1k1e5	0805v2-4	175556	52673225	0.54	0.64	basic	4.0	1024.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemov8	2024-08-05	1.55	1.0	2.58	0.32	75.0	1.0	522.5	6.0	single
zonemercy	1	29.0	1.0	1269.66	1301.46	4.31	10233	0.73	960.0	zonemercy-graft-virgo-v1_3528_v1	13B	zonemercy/Graft-Virgo-v1-Acute-v1	zonemercy-graft-virgo-v1_3528_v1	10233	52673225	0.55	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Graft-Virgo-v1	2024-08-21	1.55	1.45	1.73	0.33	24.0	1.0	67.5	40.0	single
zonemercy	1	30.0	1.0	1270.72	1301.46	4.03	10540	0.74	966.0	zonemercy-lexical-nemov8_5966_v5	13B	zonemercy/Lexical-Nemov8-1k1e5	0815v2-1	10540	52673225	0.55	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemov8	2024-08-16	1.52	1.47	1.6	0.39	23.0	1.0	55.0	52.0	single
zonemercy	1	31.0	1.0	1292.06	1301.46	1.72	106640	0.71	11368.0	zonemercy-cogent-nemo-v2-5e6_v18	13B	zonemercy/Cogent-Nemo-v2-5e6	0815v3-2	106640	52673225	0.5	0.64	basic	16.0	1024.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v2	2024-08-16	1.46	1.92	0.59	0.24	33.0	1.0	5.0	184.0	single
zonemercy	1	32.0	1.0	1291.25	1301.46	1.77	108706	0.71	10227.0	zonemercy-cogent-nemo-v2-5e6_v17	13B	zonemercy/Cogent-Nemo-v2-5e6	0815v3-2	108706	52673225	0.5	0.64	basic	16.0	1024.0	64.0	MistralForCausalLM	zonemercy/Cogent-Nemo-v2	2024-08-16	1.45	1.91	0.61	0.2	32.0	1.0	6.0	179.0	single
zonemercy	1	33.0	1.0	1248.17	1301.46	5.59	12094	0.68	1111.0	zonemercy-graft-cogent-v_3240_v1	13B	zonemercy/Graft-Cogent-v1-Acute-Nemo-v1-1e5ep1	0814v1-6	12094	52673225	0.53	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Graft-Cogent-v	2024-08-14	1.45	1.0	2.29	0.05	77.0	1.0	522.5	18.0	single
zonemercy	1	34.0	1.0	1256.36	1301.46	4.81	9553	0.71	830.0	zonemercy-lexical-nemov8_5966_v7	13B	zonemercy/Lexical-Nemov8-1k1e5	0815v2-1	9553	52673225	0.53	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemov8	2024-08-20	1.44	1.17	1.95	0.21	43.0	1.0	282.0	26.0	single
chai_backend_admin	2	35.0	35.0	1266.3	1303.03	3.88	10609	0.74	984.0	blend_domul_2024-08-22	n/a		blend_domul_2024-08-22	10609	243497713	0.54	1.0	blend						2024-08-21	1.44	1.38	1.54	0.36	27.0	27.0	98.0	55.0	blended
zonemercy	1	36.0	1.0	1248.93	1301.46	5.38	12373	0.71	1412.0	zonemercy-acute-nemo-v1-_4488_v1	13B	zonemercy/Acute-Nemo-v1-1e5ep1	0814v1-2	12373	52673225	0.53	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Acute-Nemo-v1-	2024-08-14	1.43	1.02	2.2	0.24	69.0	1.0	492.0	21.0	single
zonemercy	1	37.0	1.0	1240.99	1301.46	5.83	11555	0.75	1059.0	zonemercy-lexical-nemo-_1518_v16	13B	zonemercy/Lexical-Nemo-v4-1k1e5	zonemercy-lexical-nemo-_1518_v16	11555	52673225	0.52	0.64	basic	4.0	1024.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemo-v	2024-08-12	1.39	0.85	2.39	0.42	153.5	1.0	725.0	13.0	single
zonemercy	1	38.0	1.0	1268.93	1301.46	3.31	10529	0.73	1021.0	zonemercy-graft-virgo-v1_16_v1	13B	zonemercy/Graft-Virgo-v1-base-v1	zonemercy-graft-virgo-v1_16_v1	10529	52673225	0.55	0.64	basic	8.0	1024.0	64.0	MistralForCausalLM	zonemercy/Graft-Virgo-v1	2024-08-22	1.38	1.44	1.28	0.32	25.5	1.0	71.0	74.0	single
zonemercy	1	39.0	1.0	1264.73	1301.46	3.63	10756	0.71	958.0	zonemercy-virgo-edit-v2-1e5_v4	13B	zonemercy/Virgo-Edit-v2-1e5	0821v1-2	10756	52673225	0.54	0.64	basic	16.0	512.0	64.0	MistralForCausalLM	zonemercy/Virgo-Edit-v2-	2024-08-21	1.38	1.35	1.43	0.23	29.0	1.0	115.0	61.0	single
zonemercy	1	40.0	1.0	1239.6	1301.46	5.87	12977	0.71	1105.0	zonemercy-lexical-nemo-_1518_v17	13B	zonemercy/Lexical-Nemo-v4-1k1e5	zonemercy-lexical-nemo-_1518_v17	12977	52673225	0.52	0.64	basic	4.0	1024.0	64.0	MistralForCausalLM	zonemercy/Lexical-Nemo-v	2024-08-12	1.38	0.82	2.41	0.22	167.0	1.0	767.5	12.0	single