meta-llama-meta-llama-3-8b

developer_uid: Meliodia

submission_id: meta-llama-meta-llama-3-8b_v7

model_name: meta-base-model

model_group: meta-llama/Meta-Llama-3-

status: torndown

timestamp: 2024-07-26T15:49:39+00:00

num_battles: 12265

num_wins: 5191

celo_rating: 1139.24

family_friendly_score: 0.0

submission_type: basic

model_repo: meta-llama/Meta-Llama-3-8B

model_architecture: LlamaForCausalLM

reward_repo: ChaiML/gpt2_medium_pairwise_60m_step_937500

model_num_parameters: 8030261248.0

best_of: 4

max_input_tokens: 512

max_output_tokens: 64

display_name: meta-base-model

is_internal_developer: True

language_model: meta-llama/Meta-Llama-3-8B

model_size: 8B

ranking_group: single

us_pacific_date: 2024-07-26

win_ratio: 0.4232368528332654

generation_params: {'temperature': 1.0, 'top_p': 1.0, 'min_p': 0.0, 'top_k': 40, 'presence_penalty': 0.0, 'frequency_penalty': 0.0, 'stopping_words': ['\n'], 'max_input_tokens': 512, 'best_of': 4, 'max_output_tokens': 64, 'reward_max_token_input': 256}

formatter: {'memory_template': "{bot_name}'s Persona: {memory}\n####\n", 'prompt_template': '{prompt}\n<START>\n', 'bot_template': '{bot_name}: {message}\n', 'user_template': '{user_name}: {message}\n', 'response_template': '{bot_name}:', 'truncate_by_message': False}

reward_formatter: {'bot_template': '{bot_name}: {message}\n', 'memory_template': "{bot_name}'s Persona: {memory}\n####\n", 'prompt_template': '{prompt}\n<START>\n', 'response_template': '{bot_name}:', 'truncate_by_message': False, 'user_template': '{user_name}: {message}\n'}

Resubmit model

Running pipeline stage MKMLizer
Starting job with name meta-llama-meta-llama-3-8b-v7-mkmlizer
Waiting for job on meta-llama-meta-llama-3-8b-v7-mkmlizer to finish
meta-llama-meta-llama-3-8b-v7-mkmlizer: ╔═════════════════════════════════════════════════════════════════════╗
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║     _____            __           __                                ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║    / _/ /_ ___    __/ /  ___ ___ / /                                ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║   / _/ / // / |/|/ / _ \/ -_) -_) /                                 ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║  /_//_/\_, /|__,__/_//_/\__/\__/_/                                  ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║       /___/                                                         ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║                                                                     ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║  Version: 0.9.7                                                     ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║  Copyright 2023 MK ONE TECHNOLOGIES Inc.                            ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║  https://mk1.ai                                                     ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║                                                                     ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║  The license key for the current software has been verified as      ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║  belonging to:                                                      ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║                                                                     ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║  Chai Research Corp.                                                ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║  Account ID: 7997a29f-0ceb-4cc7-9adf-840c57b4ae6f                   ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║  Expiration: 2024-10-15 23:59:59                                    ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ║                                                                     ║
meta-llama-meta-llama-3-8b-v7-mkmlizer: ╚═════════════════════════════════════════════════════════════════════╝
meta-llama-meta-llama-3-8b-v7-mkmlizer: Downloaded to shared memory in 35.339s
meta-llama-meta-llama-3-8b-v7-mkmlizer: quantizing model to /dev/shm/model_cache, profile:s0, folder:/tmp/tmpgfhopqva, device:0
meta-llama-meta-llama-3-8b-v7-mkmlizer: Saving flywheel model at /dev/shm/model_cache
meta-llama-meta-llama-3-8b-v7-mkmlizer: quantized model in 25.859s
meta-llama-meta-llama-3-8b-v7-mkmlizer: Processed model meta-llama/Meta-Llama-3-8B in 61.198s
meta-llama-meta-llama-3-8b-v7-mkmlizer: creating bucket guanaco-mkml-models
meta-llama-meta-llama-3-8b-v7-mkmlizer: Bucket 's3://guanaco-mkml-models/' created
meta-llama-meta-llama-3-8b-v7-mkmlizer: uploading /dev/shm/model_cache to s3://guanaco-mkml-models/meta-llama-meta-llama-3-8b-v7
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /dev/shm/model_cache/config.json s3://guanaco-mkml-models/meta-llama-meta-llama-3-8b-v7/config.json
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /dev/shm/model_cache/special_tokens_map.json s3://guanaco-mkml-models/meta-llama-meta-llama-3-8b-v7/special_tokens_map.json
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /dev/shm/model_cache/tokenizer_config.json s3://guanaco-mkml-models/meta-llama-meta-llama-3-8b-v7/tokenizer_config.json
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /dev/shm/model_cache/tokenizer.json s3://guanaco-mkml-models/meta-llama-meta-llama-3-8b-v7/tokenizer.json
meta-llama-meta-llama-3-8b-v7-mkmlizer: loading reward model from ChaiML/gpt2_medium_pairwise_60m_step_937500
meta-llama-meta-llama-3-8b-v7-mkmlizer: 
Loading 0:   0%|          | 0/291 [00:00<?, ?it/s]
Loading 0:   2%|▏         | 5/291 [00:00<00:08, 35.00it/s]
Loading 0:   5%|▍         | 14/291 [00:00<00:06, 45.77it/s]
Loading 0:   8%|▊         | 22/291 [00:00<00:04, 56.52it/s]
Loading 0:  10%|▉         | 28/291 [00:00<00:05, 50.29it/s]
Loading 0:  12%|█▏        | 34/291 [00:00<00:04, 51.79it/s]
Loading 0:  14%|█▍        | 41/291 [00:00<00:05, 47.73it/s]
Loading 0:  17%|█▋        | 50/291 [00:01<00:04, 49.21it/s]
Loading 0:  20%|█▉        | 58/291 [00:01<00:04, 55.69it/s]
Loading 0:  22%|██▏       | 64/291 [00:01<00:04, 50.37it/s]
Loading 0:  24%|██▍       | 70/291 [00:01<00:04, 51.69it/s]
Loading 0:  26%|██▋       | 77/291 [00:01<00:04, 47.75it/s]
Loading 0:  29%|██▊       | 83/291 [00:01<00:05, 38.59it/s]
Loading 0:  30%|███       | 88/291 [00:01<00:05, 38.84it/s]
Loading 0:  32%|███▏      | 94/291 [00:02<00:04, 43.10it/s]
Loading 0:  34%|███▍      | 100/291 [00:02<00:04, 43.27it/s]
Loading 0:  36%|███▌      | 105/291 [00:02<00:04, 44.62it/s]
Loading 0:  38%|███▊      | 112/291 [00:02<00:03, 50.80it/s]
Loading 0:  41%|████      | 118/291 [00:02<00:03, 48.51it/s]
Loading 0:  43%|████▎     | 124/291 [00:02<00:03, 48.31it/s]
Loading 0:  45%|████▍     | 130/291 [00:02<00:03, 51.20it/s]
Loading 0:  47%|████▋     | 136/291 [00:02<00:03, 49.34it/s]
Loading 0:  49%|████▉     | 142/291 [00:02<00:02, 49.92it/s]
Loading 0:  51%|█████     | 149/291 [00:03<00:03, 45.72it/s]
Loading 0:  54%|█████▍    | 157/291 [00:03<00:02, 52.55it/s]
Loading 0:  56%|█████▌    | 163/291 [00:03<00:02, 48.35it/s]
Loading 0:  58%|█████▊    | 169/291 [00:03<00:02, 49.06it/s]
Loading 0:  60%|██████    | 176/291 [00:03<00:02, 54.22it/s]
Loading 0:  63%|██████▎   | 182/291 [00:03<00:02, 46.46it/s]
Loading 0:  64%|██████▍   | 187/291 [00:04<00:02, 35.64it/s]
Loading 0:  66%|██████▌   | 192/291 [00:04<00:02, 36.97it/s]
Loading 0:  68%|██████▊   | 197/291 [00:04<00:02, 39.61it/s]
Loading 0:  70%|██████▉   | 203/291 [00:04<00:02, 38.56it/s]
Loading 0:  73%|███████▎  | 211/291 [00:04<00:01, 46.68it/s]
Loading 0:  75%|███████▍  | 217/291 [00:04<00:01, 43.69it/s]
Loading 0:  76%|███████▋  | 222/291 [00:04<00:01, 43.49it/s]
Loading 0:  79%|███████▊  | 229/291 [00:04<00:01, 48.19it/s]
Loading 0:  81%|████████  | 235/291 [00:05<00:01, 46.47it/s]
Loading 0:  82%|████████▏ | 240/291 [00:05<00:01, 45.71it/s]
Loading 0:  85%|████████▍ | 247/291 [00:05<00:00, 50.84it/s]
Loading 0:  87%|████████▋ | 253/291 [00:05<00:00, 47.12it/s]
Loading 0:  89%|████████▊ | 258/291 [00:05<00:00, 47.15it/s]
Loading 0:  91%|█████████ | 265/291 [00:05<00:00, 52.51it/s]
Loading 0:  93%|█████████▎| 271/291 [00:05<00:00, 49.85it/s]
Loading 0:  95%|█████████▌| 277/291 [00:05<00:00, 49.51it/s]
Loading 0:  97%|█████████▋| 283/291 [00:06<00:00, 44.84it/s]
Loading 0:  99%|█████████▉| 288/291 [00:11<00:00,  3.38it/s]
                                                            
/opt/conda/lib/python3.10/site-packages/transformers/models/auto/configuration_auto.py:957: FutureWarning: The `use_auth_token` argument is deprecated and will be removed in v5 of Transformers. Please use `token` instead.
meta-llama-meta-llama-3-8b-v7-mkmlizer:   warnings.warn(
meta-llama-meta-llama-3-8b-v7-mkmlizer: /opt/conda/lib/python3.10/site-packages/transformers/models/auto/tokenization_auto.py:785: FutureWarning: The `use_auth_token` argument is deprecated and will be removed in v5 of Transformers. Please use `token` instead.
meta-llama-meta-llama-3-8b-v7-mkmlizer:   warnings.warn(
meta-llama-meta-llama-3-8b-v7-mkmlizer: /opt/conda/lib/python3.10/site-packages/transformers/models/auto/auto_factory.py:469: FutureWarning: The `use_auth_token` argument is deprecated and will be removed in v5 of Transformers. Please use `token` instead.
meta-llama-meta-llama-3-8b-v7-mkmlizer:   warnings.warn(
meta-llama-meta-llama-3-8b-v7-mkmlizer: Saving model to /tmp/reward_cache/reward.tensors
meta-llama-meta-llama-3-8b-v7-mkmlizer: Saving duration: 0.338s
meta-llama-meta-llama-3-8b-v7-mkmlizer: Processed model ChaiML/gpt2_medium_pairwise_60m_step_937500 in 5.883s
meta-llama-meta-llama-3-8b-v7-mkmlizer: creating bucket guanaco-reward-models
meta-llama-meta-llama-3-8b-v7-mkmlizer: Bucket 's3://guanaco-reward-models/' created
meta-llama-meta-llama-3-8b-v7-mkmlizer: uploading /tmp/reward_cache to s3://guanaco-reward-models/meta-llama-meta-llama-3-8b-v7_reward
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /tmp/reward_cache/config.json s3://guanaco-reward-models/meta-llama-meta-llama-3-8b-v7_reward/config.json
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /tmp/reward_cache/special_tokens_map.json s3://guanaco-reward-models/meta-llama-meta-llama-3-8b-v7_reward/special_tokens_map.json
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /tmp/reward_cache/tokenizer_config.json s3://guanaco-reward-models/meta-llama-meta-llama-3-8b-v7_reward/tokenizer_config.json
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /tmp/reward_cache/merges.txt s3://guanaco-reward-models/meta-llama-meta-llama-3-8b-v7_reward/merges.txt
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /tmp/reward_cache/vocab.json s3://guanaco-reward-models/meta-llama-meta-llama-3-8b-v7_reward/vocab.json
meta-llama-meta-llama-3-8b-v7-mkmlizer: cp /tmp/reward_cache/tokenizer.json s3://guanaco-reward-models/meta-llama-meta-llama-3-8b-v7_reward/tokenizer.json
Job meta-llama-meta-llama-3-8b-v7-mkmlizer completed after 94.98s with status: succeeded
Stopping job with name meta-llama-meta-llama-3-8b-v7-mkmlizer
Pipeline stage MKMLizer completed in 95.87s
Running pipeline stage MKMLKubeTemplater
Pipeline stage MKMLKubeTemplater completed in 0.10s
Running pipeline stage ISVCDeployer
Creating inference service meta-llama-meta-llama-3-8b-v7
Waiting for inference service meta-llama-meta-llama-3-8b-v7 to be ready
Inference service meta-llama-meta-llama-3-8b-v7 ready after 80.84639883041382s
Pipeline stage ISVCDeployer completed in 82.38s
Running pipeline stage StressChecker
Received healthy response to inference request in 1.878431797027588s
Received healthy response to inference request in 1.0842959880828857s
Received healthy response to inference request in 0.7779312133789062s
Received healthy response to inference request in 0.9490232467651367s
Received healthy response to inference request in 1.0930004119873047s
5 requests
0 failed requests
5th percentile: 0.8121496200561523
10th percentile: 0.8463680267333984
20th percentile: 0.9148048400878906
30th percentile: 0.9760777950286865
40th percentile: 1.0301868915557861
50th percentile: 1.0842959880828857
60th percentile: 1.0877777576446532
70th percentile: 1.091259527206421
80th percentile: 1.2500866889953615
90th percentile: 1.5642592430114748
95th percentile: 1.7213455200195311
99th percentile: 1.8470145416259764
mean time: 1.1565365314483642
Pipeline stage StressChecker completed in 6.48s
meta-llama-meta-llama-3-8b_v7 status is now deployed due to DeploymentManager action
meta-llama-meta-llama-3-8b_v7 status is now inactive due to auto deactivation removed underperforming models
admin requested tearing down of meta-llama-meta-llama-3-8b_v7
Running pipeline stage ISVCDeleter
Checking if service meta-llama-meta-llama-3-8b-v7 is running
Tearing down inference service meta-llama-meta-llama-3-8b-v7
Service meta-llama-meta-llama-3-8b-v7 has been torndown
Pipeline stage ISVCDeleter completed in 5.08s
Running pipeline stage MKMLModelDeleter
Cleaning model data from S3
Cleaning model data from model cache
Deleting key meta-llama-meta-llama-3-8b-v7/config.json from bucket guanaco-mkml-models
Deleting key meta-llama-meta-llama-3-8b-v7/flywheel_model.0.safetensors from bucket guanaco-mkml-models
Deleting key meta-llama-meta-llama-3-8b-v7/special_tokens_map.json from bucket guanaco-mkml-models
Deleting key meta-llama-meta-llama-3-8b-v7/tokenizer.json from bucket guanaco-mkml-models
Deleting key meta-llama-meta-llama-3-8b-v7/tokenizer_config.json from bucket guanaco-mkml-models
Cleaning model data from model cache
Deleting key meta-llama-meta-llama-3-8b-v7_reward/config.json from bucket guanaco-reward-models
Deleting key meta-llama-meta-llama-3-8b-v7_reward/merges.txt from bucket guanaco-reward-models
Deleting key meta-llama-meta-llama-3-8b-v7_reward/reward.tensors from bucket guanaco-reward-models
Deleting key meta-llama-meta-llama-3-8b-v7_reward/special_tokens_map.json from bucket guanaco-reward-models
Deleting key meta-llama-meta-llama-3-8b-v7_reward/tokenizer.json from bucket guanaco-reward-models
Deleting key meta-llama-meta-llama-3-8b-v7_reward/tokenizer_config.json from bucket guanaco-reward-models
Deleting key meta-llama-meta-llama-3-8b-v7_reward/vocab.json from bucket guanaco-reward-models
Pipeline stage MKMLModelDeleter completed in 5.48s
meta-llama-meta-llama-3-8b_v7 status is now torndown due to DeploymentManager action