>>> import unicodedata >>> unicodedata.category(u'A') 'Lu' >>> unicodedata.category(u'4') 'Nd' >>> unicodedata.numeric(u'\u2155') # \u2155 is fraction (1/5) 0.2 >>>