为了账号安全,请及时绑定邮箱和手机立即绑定

如何为句子列表创建窗口/块?

如何为句子列表创建窗口/块?

万千封印 2021-09-25 21:06:01
我有一句话的名单,我想创建skipgram(window size = 3)但我DONT希望跨句子柜台跨度,因为他们都无关。所以,如果我有以下句子:[["my name is John"] , ["This PC is black"]]三胞胎将是:[my name is][name is john][this PC is][PC is black]最好的方法是什么?
查看完整描述

3 回答

?
一只斗牛犬

TA贡献1784条经验 获得超2个赞

这是一个简单的功能来做到这一点。


def skipgram(corpus, window_size = 3):

    sg = []

    for sent in corpus:

        sent = sent[0].split()

        if len(sent) <= window_size:

            sg.append(sent)

        else:

            for i in range(0, len(sent)-window_size+1):

                sg.append(sent[i: i+window_size])

    return sg


corpus = [["my name is John"] , ["This PC is black"]]

skipgram(corups)


查看完整回答
反对 回复 2021-09-25
?
人到中年有点甜

TA贡献1895条经验 获得超7个赞

你并不是真的想要一个skipgram本身,但你想要一个按大小划分的块,试试这个:


from lazyme import per_chunk


tokens = "my name is John".split()

list(per_chunk(tokens, 2))

[出去]:


[('my', 'name'), ('is', 'John')]

如果你想要一个滚动窗口,即ngrams:


from lazyme import per_window


tokens = "my name is John".split()

list(per_window(tokens, 2))

[出去]:


[('my', 'name'), ('name', 'is'), ('is', 'John')]

同样在 ngrams 的 NLTK 中:


from nltk import ngrams


tokens = "my name is John".split()

list(ngrams(tokens, 2))

[出去]:


[('my', 'name'), ('name', 'is'), ('is', 'John')]

如果你想要实际的skipgrams,如何在python中计算skipgrams?


from nltk import skipgrams


tokens = "my name is John".split()

list(skipgrams(tokens, n=2, k=1))

[出去]:


[('my', 'name'),

 ('my', 'is'),

 ('name', 'is'),

 ('name', 'John'),

 ('is', 'John')]


查看完整回答
反对 回复 2021-09-25
?
慕村225694

TA贡献1880条经验 获得超4个赞

尝试这个!


from nltk import ngrams


def generate_ngrams(sentences,window_size =3):

    for sentence in sentences:

        yield from ngrams(sentence[0].split(), window_size)


sentences= [["my name is John"] , ["This PC is black"]]


for c in generate_ngrams(sentences,3):

    print (c)


#output:

('my', 'name', 'is')

('name', 'is', 'John')

('This', 'PC', 'is')

('PC', 'is', 'black')


查看完整回答
反对 回复 2021-09-25
  • 3 回答
  • 0 关注
  • 186 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信