Cho em hỏi trong python thì làm sao để khôi phục dấu tiếng việt khi mình nhập 1 câu không dấu? Em cảm ơn!



  • Em ví dụ 1 câu:
    Input : Toi thich ban.
    Output: Tôi thích bạn.

    Code của em làm là từ có dấu sang không dấu.
    Và giờ em muốn nó từ không dấu sang có dấu nhưng em không biết cách nào?

    -- coding: utf-8 --

    import string
    import re

    INTAB = "ạảãàáâậầấẩẫăắằặẳẵóòọõỏôộổỗồốơờớợởỡéèẻẹẽêếềệểễúùụủũưựữửừứíìịỉĩýỳỷỵỹđ"

    OUTTAB = "a"*17 + "o"*17 + "e"*11 + "u"*11 + "i"*5 + "y"*5 + "d"

    r = re.compile("|".join(INTAB)) #Join : convert
    replaces_dict = dict(zip(INTAB, OUTTAB))

    def khongdau(utf8_str):
    return r.sub(lambda m: replaces_dict[m.group(0)], utf8_str) #lambda : hàm vô danh

    khongdau("Tôi thích bạn")

    -> Toi thich ban


Log in to reply
 

Looks like your connection to Cộng đồng Python Việt Nam was lost, please wait while we try to reconnect.