Revise the measurement description for MAIA
Browse files- src_maia/tasks.py +3 -3
src_maia/tasks.py
CHANGED
|
@@ -143,7 +143,7 @@ SU_DESCRIPTION = """### Summarization (SUM) --- *Generative task*
|
|
| 143 |
| 7 | Riassumi il seguente articolo di giornale: '{{source}}'\\nRiassunto: |
|
| 144 |
| 8 | Devi risolvere un compito di sintesi automatica del testo. Riassumi il seguente articolo di giornale: '{{source}}'\\nRiassunto: |
|
| 145 |
|
| 146 |
-
<small>**Combined Performance** = (1 - (**Best Prompt** - **Prompt Average**) / 100) * **Best Prompt**. **Prompt Average** =
|
| 147 |
|
| 148 |
"""
|
| 149 |
|
|
@@ -184,7 +184,7 @@ MAIA_MC_DESCRIPTION = """### Multimodal AI Assessment (MAIA) — *Multiple-Choic
|
|
| 184 |
| 5 | Dato il video, scegli la descrizione corretta:\\nA. {{A}}\\nB. {{B}}\\nRispondi solo A o B. '{{video}}' |
|
| 185 |
| 6 | Devi risolvere un compito di domande su video. Dato il video, scegli la descrizione corretta:\\nA. {{A}}\\nB. {{B}}\\nRispondi solo A o B. '{{video}}' |
|
| 186 |
|
| 187 |
-
<small>**Combined Performance** = (1 - (**Best Prompt** - **Prompt Average**) / 100) * **Best Prompt**. **Prompt Average**
|
| 188 |
|
| 189 |
"""
|
| 190 |
|
|
@@ -196,7 +196,7 @@ MAIA_GEN_DESCRIPTION = """### Multimodal AI Assessment (MAIA) — *Generative Ta
|
|
| 196 |
| 7 | '{{video}}' Rispondi alla seguente domanda con una singola frase.\\n'{{text}}' |
|
| 197 |
| 8 | '{{video}}' Devi svolgere un compito di Visual Question Answering. Rispondi alla seguente domanda con una singola frase.\\n'{{text}}' |
|
| 198 |
|
| 199 |
-
<small>**Combined Performance** = (1 - (**Best Prompt** - **Prompt Average**) / 100) * **Best Prompt**. **Prompt Average** =
|
| 200 |
|
| 201 |
"""
|
| 202 |
|
|
|
|
| 143 |
| 7 | Riassumi il seguente articolo di giornale: '{{source}}'\\nRiassunto: |
|
| 144 |
| 8 | Devi risolvere un compito di sintesi automatica del testo. Riassumi il seguente articolo di giornale: '{{source}}'\\nRiassunto: |
|
| 145 |
|
| 146 |
+
<small>**Combined Performance** = (1 - (**Best Prompt** - **Prompt Average**) / 100) * **Best Prompt**. **Prompt Average** = Rouge averaged over the 2 prompts. **Best Prompt** = Rouge of the best prompt. **Prompt ID** = ID of the best prompt (see legend above). </small>
|
| 147 |
|
| 148 |
"""
|
| 149 |
|
|
|
|
| 184 |
| 5 | Dato il video, scegli la descrizione corretta:\\nA. {{A}}\\nB. {{B}}\\nRispondi solo A o B. '{{video}}' |
|
| 185 |
| 6 | Devi risolvere un compito di domande su video. Dato il video, scegli la descrizione corretta:\\nA. {{A}}\\nB. {{B}}\\nRispondi solo A o B. '{{video}}' |
|
| 186 |
|
| 187 |
+
<small>**Combined Performance** = (1 - (**Best Prompt** - **Prompt Average**) / 100) * **Best Prompt**. **Prompt Average** Accuracy averaged over the 2 prompts. **Best Prompt** = Accuracy of the best prompt. **Prompt ID** = ID of the best prompt (see legend above). </small>
|
| 188 |
|
| 189 |
"""
|
| 190 |
|
|
|
|
| 196 |
| 7 | '{{video}}' Rispondi alla seguente domanda con una singola frase.\\n'{{text}}' |
|
| 197 |
| 8 | '{{video}}' Devi svolgere un compito di Visual Question Answering. Rispondi alla seguente domanda con una singola frase.\\n'{{text}}' |
|
| 198 |
|
| 199 |
+
<small>**Combined Performance** = (1 - (**Best Prompt** - **Prompt Average**) / 100) * **Best Prompt**. **Prompt Average** = Rouge-1 averaged over the 2 prompts. **Best Prompt** = Rouge-1 of the best prompt. **Prompt ID** = ID of the best prompt (see legend above). </small>
|
| 200 |
|
| 201 |
"""
|
| 202 |
|