Spaces:

KevSun
/

MT_Eval

Sleeping

App Files Files Community

KevSun commited on Jul 26, 2024

Commit

764fd79

verified ·

1 Parent(s): dc4d01d

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -37

app.py CHANGED Viewed

@@ -5,23 +5,19 @@ import jieba
 # Function to calculate BLEU score
 def calculate_bleu(translations, references):
-    bleu = sacrebleu.corpus_bleu(translations, [references])
-    return bleu.score
 # Function to calculate TER score
 def calculate_ter(translations, references):
-    ter = sacrebleu.corpus_ter(translations, [references])
-    ter_score = ter.score
-    return ter_score
 # Function to calculate CHRF score
 def calculate_chrf(translations, references):
-    chrf = sacrebleu.corpus_chrf(translations, [references])
-    return chrf.score
 # Function to calculate BERTScore
-def calculate_bertscore(translations, references, target_lang):
-    P, R, F1 = bert_score(translations, references, lang=target_lang)
     return F1.mean().item()
 # Streamlit app
@@ -68,15 +64,8 @@ source_lang = st.selectbox("Select Source Language", list(languages.keys()))
 target_lang = st.selectbox("Select Target Language", list(languages.keys()))
 # Input fields for custom language codes if "Other" is selected
-if source_lang == "Other":
-    source_lang_code = st.text_input("Enter Source Language Code (ISO 639-1):")
-else:
-    source_lang_code = languages[source_lang]
-if target_lang == "Other":
-    target_lang_code = st.text_input("Enter Target Language Code (ISO 639-1):")
-else:
-    target_lang_code = languages[target_lang]
 # Input fields for translations and references
 translation_input = st.text_area("Translated Text", height=200)
@@ -84,22 +73,23 @@ reference_input = st.text_area("Reference Translation", height=200)
 # Evaluate button
 if st.button("Evaluate"):
-    translations = [translation_input.strip()]
-    references = [reference_input.strip()]
-    # Handle tokenization if necessary (e.g., for Chinese)
-    if source_lang_code == "zh" or target_lang_code == "zh":
-        translations = [' '.join(jieba.cut(text)) for text in translations]
-        references = [' '.join(jieba.cut(text)) for text in references]
-    bleu_score = calculate_bleu(translations, references)
-    ter_score = calculate_ter(translations, references)
-    chrf_score = calculate_chrf(translations, references)
-    bertscore = calculate_bertscore(translations, references, target_lang_code)
-    st.write(f"**BLEU Score:** {bleu_score:.2f}")
-    st.write(f"**TER Score:** {ter_score:.2f}")
-    st.write(f"**CHRF Score:** {chrf_score:.2f}")
-    st.write(f"**BERTScore:** {bertscore:.2f}")

 # Function to calculate BLEU score
 def calculate_bleu(translations, references):
+    return sacrebleu.corpus_bleu(translations, [references]).score
 # Function to calculate TER score
 def calculate_ter(translations, references):
+    return sacrebleu.corpus_ter(translations, [references]).score
 # Function to calculate CHRF score
 def calculate_chrf(translations, references):
+    return sacrebleu.corpus_chrf(translations, [references]).score
 # Function to calculate BERTScore
+def calculate_bertscore(translations, references, lang):
+    P, R, F1 = bert_score(translations, references, lang=lang)
     return F1.mean().item()
 # Streamlit app
 target_lang = st.selectbox("Select Target Language", list(languages.keys()))
 # Input fields for custom language codes if "Other" is selected
+source_lang_code = st.text_input("Enter Source Language Code (ISO 639-1):", value=languages[source_lang]) if source_lang == "Other" else languages[source_lang]
+target_lang_code = st.text_input("Enter Target Language Code (ISO 639-1):", value=languages[target_lang]) if target_lang == "Other" else languages[target_lang]
 # Input fields for translations and references
 translation_input = st.text_area("Translated Text", height=200)
 # Evaluate button
 if st.button("Evaluate"):
+    if translation_input and reference_input:
+        translations = [translation_input.strip()]
+        references = [reference_input.strip()]
+        # Handle tokenization if necessary (e.g., for Chinese)
+        if source_lang_code == "zh" or target_lang_code == "zh":
+            translations = [' '.join(jieba.cut(text)) for text in translations]
+            references = [' '.join(jieba.cut(text)) for text in references]
+        bleu_score = calculate_bleu(translations, references)
+        ter_score = calculate_ter(translations, references)
+        chrf_score = calculate_chrf(translations, references)
+        bertscore = calculate_bertscore(translations, references, target_lang_code)
+        st.write(f"**BLEU Score:** {bleu_score:.2f}")
+        st.write(f"**TER Score:** {ter_score:.2f}")
+        st.write(f"**CHRF Score:** {chrf_score:.2f}")
+        st.write(f"**BERTScore:** {bertscore:.2f}")
+    else:
+        st.error("Please provide both translated text and reference translation.")